需要金幣:![]() ![]() |
資料包括:完整論文 | ![]() |
![]() |
轉換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 | 論文字數(shù):39359 | ![]() | |
折扣與優(yōu)惠:團購最低可5折優(yōu)惠 - 了解詳情 | 論文格式:Word格式(*.doc) | ![]() |
摘要:智能機器人是國家“863”計劃重點支持的方向,語音識別和合成技術是智能機器人技術的主要體現(xiàn)之一,可讓機器人與人進行自然的人機對話,使機器人能聽從人的指揮。把這種智能機器人應用于導游行業(yè),研制出語音交互式導游機器人,將完全代替人力完成導游工作。 語音交互以語音識別和語音合成為基礎。語音識別是將音頻信息轉換成文本或者其它形式的計算機能夠處理的信息的技術,語音合成是將文本文件轉換成語音信息。經過國內外多年的研究探索,出現(xiàn)了許多語音識別的方法,其中隱馬爾可夫模型成為大詞匯量連續(xù)語音識別的主導方法。本文從語音識別系統(tǒng)的系統(tǒng)框架出發(fā),重點探討研究了基于隱馬爾可夫模型的語音識別的實現(xiàn)方法和POSLA算法在語音合成系統(tǒng)中的應用,研究了AS-R機器人的運動原理。本文完成了對微軟語音開發(fā)包MS Speech SDK的二次開發(fā),在嵌入機器人本體的PC機上,通過在VC++ 6.0軟件上編程實現(xiàn)了語音識別和語音合成功能,完成了基于機械學院的導航軟件的設計,建立了語音識別常用語的語音庫,并實現(xiàn)了用語音控制機器人的運動。
關鍵詞:語音識別;語音合成;VC++ 6.0;微軟語音開發(fā)包;機器人控制
目錄 摘要 ABSTRACT 第1章 緒論-1 1.1國內外語音導游機器人技術發(fā)展歷程及現(xiàn)狀-1 1.1.1語音技術的發(fā)展歷程及現(xiàn)狀-1 1.1.2 導游機器人的發(fā)展現(xiàn)狀-2 1.2 語音交互式導游機器人發(fā)展方向-3 1.2.1 語音交互技術-3 1.2.2 導游機器人的發(fā)展方向-4 1.3 語音交互導游機器人研究的意義及本文研究的內容-4 1.3.1 語音交互導游機器人研究的意義-4 1.3.2本文研究的主要內容-5 1.4 本文的內容結構-5 第2章 語音識別原理-7 2.1 聽覺語音學-7 2.2漢語語音學基礎-8 2.2.1 音素和音節(jié)-8 2.2.2 元音和輔音-8 2.2.3 聲母和韻母-8 2.2.4 漢語語音的主要特點-9 2.3 語音識別的基本原理-9 2.4 語音識別的預處理-9 2.4.1 識別單元選取-9 2.4.2 語音識別的數(shù)字化-10 2.4.3 語音識別的預加重-11 2.4.4 語音識別的分幀加窗-11 2.4.5 端點檢測-12 2.5 特征參數(shù)的提取-13 2.5.1提取參數(shù)方法簡介-13 2.5.2 Mel頻標倒譜系數(shù)(MFCC)-14 2.6 模型訓練及模式匹配-15 2.7 做出決策-16 2.8 隱馬爾可夫模型(HMM)-16 2.8.1隱馬爾可夫模型(HMM)的數(shù)學定義-16 2.8.2 HMM的基本元素-17 2.8.3隱馬爾可夫模型的基本問題-17 2.9本章小節(jié)-19 第3章 語音合成原理-21 3.1語音信號生成的數(shù)學模型-21 3.1.1 激勵模型-21 3.1.2聲道模型-22 3.1.3 輻射模型-22 3.1.4 完整的語音信號數(shù)字模型-22 3.2 當前使用的幾種主要的語音合成技術-23 3.2.1 共振峰合成-23 3.2.2 LPC(線性預測)參數(shù)合成-24 3.2.3 POSLA合成-25 3.3 文語轉換系統(tǒng)-26 3.3.1 文本分析-27 3.3.2 韻律控制-27 3.3.3 語音合成-27 3.4 本章小結-28 第4章 語音識別和合成的實現(xiàn)-29 4.1 語音識別概述-29 4.1.1 開發(fā)環(huán)境選擇-29 4.1.2 SAPI 5.1簡介-29 4.2 語音識別功能的實現(xiàn)-31 4.2.1初始化模塊-31 4.2.2 語音識別處理-32 4.3 語音合成功能的實現(xiàn)-35 4.3.1初始化模塊-35 4.3.2 設置朗讀的聲音、音量、語速和格式-36 4.3.3 讀取wav文件-37 4.4 聽寫功能的實現(xiàn)-38 4.5 本章小結-39 第5章 導航軟件的制作-41 5.1 語音交互式導游機器人主頁面-41 5.2語音交互的基本實現(xiàn)-41 5.3問題回答模式-43 5.4 播放視頻文件-44 5.5 語音實現(xiàn)對音量、語速的控制-46 5.6 本章小結-47 第6章 語音交互功能在AS-R機器人上的應用-49 6.1 AS-R移動小車簡介-49 6.2 AS-R小車運動控制-49 6.2.1系統(tǒng)的概念-50 6.2.2 設備和接口的概念-50 6.2.3 VC實現(xiàn)小車運動控制-50 6.3在VC上實現(xiàn)語音控制小車的運動-51 6.4 本章小結-52 第7章 自然語言的識別-53 7.1 自然語言的概念與特點-53 7.1.1 自然語言的概念-53 7.1.2 自然語言的特點-53 7.2 自然語言理解與語言模型-53 7.3 句法模型與概念凸現(xiàn)-54 7.3.1 句法模型-54 7.3.2 概念凸現(xiàn)-55 7.3.3 概念擴展-55 7.4 自然語言識別的實現(xiàn)-55 7.5 本章小結-56 第8章 動態(tài)語音庫的實現(xiàn)-57 8.1 鏈表簡述-57 8.1.1 鏈表的存儲狀態(tài)-57 8.1.2 鏈表的描述-57 8.2 鏈表結構在程序中的應用-58 8.3 XML文件-599 8.4 本章小結-60 第9章 結論與展望-61 9.1結論-61 9.2不足之處及未來展望-61 參考文獻-63 致 謝-65 |