当前位置:主页 > 科技论文 > 网络通信论文 >

Android平台孤立词语音识别算法研究与实现

发布时间:2018-08-29 10:05
【摘要】:语音识别是通过机器把语音信号理解、识别转成相应的命令或文本,并让机器执行文本或指令完成人机交互的技术。语音识别技术的研究对象是语音信号,其中涉及到众多的学科领域,如心理学、语言学、计算机科学、信号处理等等,它也是模式识别重要的分支。同时,在移动互联网,大数据蓬勃发展的时代背景下,涌现出更多基于智能终端的语音识别技术的应用,它们在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域扮演着重要的角色,所以研究智能终端语言识别技术,提高语音识别的准确率和实时性是十分有现实意义的。论文研究了语音识别关键技术,主要包括了如下四个方面:1、设计实现了基于Android平台的语音信息采集系统。实现了在Android平台上的语音信息采集、保存、音频数据的播放以及整个软件功能模块设计。为后期对语音信号做进一步分析打下基础。2、研究语音信号预处理的方法与技术。实现了语音信号的预滤波、预加重、分帧加窗、端点检测。滤除了语音信号中的电源噪声,环境噪声;获得了短时平稳的语音帧。从而计算出满足特征参数提取条件的语音信号。3、研究、改进了语音信号特征参数提取算法。着重研究了基于人耳听觉模型的梅尔倒谱系数(MFCC)特征参数提取算法;利用一半的幅度谱计算功率谱,利用频率解析度初始化梅尔三角滤波器组,对梅尔三角滤波器响应做对数的立方压缩实现算法改进,在一定程度上提高特征提取算法的性能。4、研究了语音识别模型。重点实现了动态时间规整(DTW)、隐马尔可夫(HMM)这两种识别算法。通过这两种算法对数字0到9汉语语音的特征参数进行训练和识别,利用多人采样进行实验,发现隐马尔可夫模型的识别率优于动态时间规整算法。实验结果表明:基于本文算法的孤立词语音识别系统的识别率达到60%左右,基本满足系统设计的要求。
[Abstract]:Speech recognition is a technology that can translate the speech signal into the corresponding command or text by the machine, and let the machine execute the text or command to complete the human-computer interaction. The research object of speech recognition technology is speech signal, which involves many disciplines, such as psychology, linguistics, computer science, signal processing and so on. It is also an important branch of pattern recognition. At the same time, under the background of the mobile Internet and big data's vigorous development, more and more applications of speech recognition technology based on intelligent terminals have emerged. They have been applied in industry, household appliances, communications, automotive electronics, medical treatment, and home service. Consumer electronics and other fields play an important role, so the research of intelligent terminal language recognition technology to improve the accuracy and real-time speech recognition is of great practical significance. In this paper, the key technologies of speech recognition are studied, including the following four aspects: 1. A speech information acquisition system based on Android platform is designed and implemented. The design of voice information acquisition, storage, audio data playing and the whole software function module on Android platform is realized. It lays a foundation for further analysis of speech signal, and studies the method and technology of speech signal preprocessing. Speech signal pre-filtering, pre-weighting, framing plus windows, endpoint detection. The power source noise and ambient noise are removed from the speech signal, and a short and stable speech frame is obtained. Thus, the speech signal. 3, which meets the condition of feature parameter extraction, is calculated, and the algorithm of feature parameter extraction for speech signal is improved. The algorithm of extracting characteristic parameters of Mel cepstrum coefficient (MFCC) based on human auditory model is studied emphatically, the power spectrum is calculated by half amplitude spectrum, and the Mel triangular filter bank is initialized by frequency resolution. The algorithm of logarithmic cubic compression of the response of the Mel triangle filter is improved, and the performance of the feature extraction algorithm is improved to a certain extent. The speech recognition model is studied. Two recognition algorithms, dynamic time warping (DTW), hidden Markov (HMM), are implemented. The two algorithms are used to train and recognize the feature parameters of the number 0 to 9 Chinese speech. The experimental results show that the recognition rate of the hidden Markov model is better than that of the dynamic time warping algorithm. The experimental results show that the recognition rate of the isolated words speech recognition system based on this algorithm is about 60%, which basically meets the requirements of the system design.
【学位授予单位】:湖南科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34;TP316

【相似文献】

相关期刊论文 前10条

1 李挺;孤立词语音识别系统的一种实用精简算法[J];江南大学学报;2003年02期

2 邝航宇;张军;季飞;韦岗;;一种基于联合得分的孤立词语音识别系统[J];计算机工程;2006年10期

3 张晨燕;孙成立;;非特定人孤立词语音识别系统的片上实现[J];计算机工程与应用;2007年13期

4 马莉;党幼云;;特定人孤立词语音识别系统的仿真与分析[J];西安工程科技学院学报;2007年03期

5 姚徐;李永宏;单广荣;于洪志;;藏语孤立词语音识别系统研究[J];西北民族大学学报(自然科学版);2009年01期

6 刘丽媛;严家明;;一种孤立词语音识别的实现方法及改进[J];现代电子技术;2010年16期

7 孙行伟;贾春梅;;基于孤立词语音识别定位系统的研究与设计[J];宁波工程学院学报;2010年03期

8 朱淑琴;魏威;;基于神经网络的汉语孤立词语音识别[J];微计算机信息;2012年09期

9 孙光民,董笑盈;基于神经网络的汉语孤立词语音识别[J];北京工业大学学报;2002年03期

10 刘金伟;黄樟钦;侯义斌;;基于片上系统的孤立词语音识别算法设计[J];计算机工程;2007年13期

相关会议论文 前7条

1 丁国宏;李成荣;徐波;;非特定人孤立词语音识别系统在定点DSP上的实现[A];第六届全国人机语音通讯学术会议论文集[C];2001年

2 李峰;浦剑涛;李成荣;;基于声韵母建模基元拼接和整词识别的非特定人孤立词语音识别系统的研究[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

3 郭莉莉;王迪;常玲;;基于DSP的孤立词语音识别系统在汽车导航中的应用[A];第十一届沈阳科学学术年会暨中国汽车产业集聚区发展与合作论坛论文集(信息科学与工程技术分册)[C];2014年

4 李明;王之禹;温源;侯震;俞铁城;;一种高效的非特定人孤立词识别方法[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

5 刘金伟;黄樟钦;侯义斌;;基于SoC的孤立词语音识别算法的C语言仿真[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

6 张歆奕;卢敦陆;张有为;;基于DSP芯片的语音控制指令识别最小系统[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年

7 林波;吕明;;基于DTW改进算法的孤立词识别系统的仿真与分析[A];第八届全国人机语音通讯学术会议论文集[C];2005年

相关硕士学位论文 前10条

1 杨泉清;Android平台孤立词语音识别算法研究与实现[D];湖南科技大学;2015年

2 程晓伟;非特定人孤立词语音识别算法研究与实验分析[D];中国地质大学(北京);2009年

3 卞洁;非特定人孤立词语音识别系统若干关键技术的研究[D];大连理工大学;2005年

4 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年

5 李建宁;汉语孤立词语音识别的研究与实现[D];西北大学;2007年

6 时晓东;孤立词语音识别系统设计研究[D];浙江大学;2006年

7 李宏言;小词汇量汉语孤立词语音识别的理论与技术研究[D];中南大学;2006年

8 路娜;孤立词语音识别系统的研究与设计[D];曲阜师范大学;2014年

9 熊中谅;汉语孤立词语音识别系统设计[D];南昌大学;2014年

10 江官星;非特定人孤立词语音识别系统的研究[D];西南交通大学;2006年



本文编号:2210872

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2210872.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户341fe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com