語音是人類進行信息交換的一種最便捷的方式, 近些年來隨著計算機、通訊技術的發(fā)展, 語音識別技術的重要性進一步得以體現(xiàn)。與此同時, 在機器人研究領域, 智能機器人成為研究的熱點。智能機器人系統(tǒng)綜合運用了多種人工智能技術, 其目標是建立起一個 人 的模型, 讓機器人聽懂人的語言就是其中之一[ 1] 。語音識別是研究如何采用數(shù)字信號處理技術自動提取以及決定語音信號中最基本、最有意義的信息的一門新興的邊緣學科。目前, 常用的語音識別算法有: 基于模板匹配的動態(tài)時間規(guī)整法 (DTW) 、基于統(tǒng)計模型的隱馬爾柯夫模型法(HMM) 以及基于神經(jīng)網(wǎng)絡的識別法等[ 2] 。進入 20 世紀 80 年代以后, 語音識別技術的研究更加活躍, 研究的重點也由小詞匯量、特定人非連續(xù)的語音識別逐漸轉向大詞匯量、非特定人連續(xù)語音識別。在研究思路上也發(fā)生了重大變化, 即由傳統(tǒng)的基于標準模板匹配的技術思路開始轉向基于統(tǒng)計模型、特別是隱馬爾柯夫模型( HMM) 的技術思路。但是, 在識別詞匯量不是很大的應用場合中, 基于模板匹配的語音識別技術不但簡單方便、實時性好, 而且有著較高的識別率, 所以仍然有著廣泛的應用前景。本文將基于模板匹配的語音識別技術成功的應用于機器人控制系統(tǒng), 實現(xiàn)了機器人的語音控制, 使機器人具有了聽覺功能。
1 基于模板匹配的語音識別技術
語音信號一個極其重要的特點就是 短時性 , 即語音信號的特征是隨時間而變化的, 但在一段較短的時間間隔中, 可以認為語音信號的特征基本保持不變, 這也是語音信號數(shù)字處理的一個重要出發(fā)點。
1. 1 語音識別的基本原理
語音信號的發(fā)聲模型如圖 1 所示。時變數(shù)字濾波器 H ( z ) 用來模擬聲道的形狀, 增益因子 G 給出聲音的強度。在處理時, 常認為在一個短時段內聲道形狀基本保持不變, 即可設在短時段內數(shù)字濾波器是 時不變 的, 當設濾波器的 Z 傳遞函數(shù)H ( z ) 為全極點模型時( 實際并非全極點模型, 全極點模型是一個簡化的模型, 但是它足以描述大多數(shù)情況下聲音的產(chǎn)生) , H ( z ) 可表示為:
0.png (58.17 KB, 下載次數(shù): 18)
下載附件
2018-5-19 04:43 上傳
完整的word格式文檔51黑下載地址:
機器人語音控制及其實現(xiàn)-羅志增.docx
(244.47 KB, 下載次數(shù): 10)
2018-5-18 10:18 上傳
點擊文件名下載附件
下載積分: 黑幣 -5
|