語音是人類進行信息交換的一種最便捷的方式, 近些年來隨著計算機、通訊技術的發展, 語音識別技術的重要性進一步得以體現。與此同時, 在機器人研究領域, 智能機器人成為研究的熱點。智能機器人系統綜合運用了多種人工智能技術, 其目標是建立起一個 人 的模型, 讓機器人聽懂人的語言就是其中之一[ 1] 。語音識別是研究如何采用數字信號處理技術自動提取以及決定語音信號中最基本、最有意義的信息的一門新興的邊緣學科。目前, 常用的語音識別算法有: 基于模板匹配的動態時間規整法 (DTW) 、基于統計模型的隱馬爾柯夫模型法(HMM) 以及基于神經網絡的識別法等[ 2] 。進入 20 世紀 80 年代以后, 語音識別技術的研究更加活躍, 研究的重點也由小詞匯量、特定人非連續的語音識別逐漸轉向大詞匯量、非特定人連續語音識別。在研究思路上也發生了重大變化, 即由傳統的基于標準模板匹配的技術思路開始轉向基于統計模型、特別是隱馬爾柯夫模型( HMM) 的技術思路。但是, 在識別詞匯量不是很大的應用場合中, 基于模板匹配的語音識別技術不但簡單方便、實時性好, 而且有著較高的識別率, 所以仍然有著廣泛的應用前景。本文將基于模板匹配的語音識別技術成功的應用于機器人控制系統, 實現了機器人的語音控制, 使機器人具有了聽覺功能。
1 基于模板匹配的語音識別技術
語音信號一個極其重要的特點就是 短時性 , 即語音信號的特征是隨時間而變化的, 但在一段較短的時間間隔中, 可以認為語音信號的特征基本保持不變, 這也是語音信號數字處理的一個重要出發點。
1. 1 語音識別的基本原理
語音信號的發聲模型如圖 1 所示。時變數字濾波器 H ( z ) 用來模擬聲道的形狀, 增益因子 G 給出聲音的強度。在處理時, 常認為在一個短時段內聲道形狀基本保持不變, 即可設在短時段內數字濾波器是 時不變 的, 當設濾波器的 Z 傳遞函數H ( z ) 為全極點模型時( 實際并非全極點模型, 全極點模型是一個簡化的模型, 但是它足以描述大多數情況下聲音的產生) , H ( z ) 可表示為:
完整的word格式文檔51黑下載地址:
機器人語音控制及其實現-羅志增.docx
(244.47 KB, 下載次數: 10)
2018-5-18 10:18 上傳
點擊文件名下載附件
|