当前位置:主页 > 科技论文 > 网络通信论文 >

藏语安多方言文本相关的说话人识别研究

发布时间:2020-04-15 13:30
【摘要】:伴随着科学与技术的快速发展,智能设备已经逐渐进入了人们生活中。作为最核心的部分人机交互也从以往的手指、手势操控而慢慢地转变为人类交流自然且高效的方式—语音。语音体现人机交互的方式主要有两个方面,一个是让机器自己发出声音,另一个是让机器听懂人类所说的话。而语音识别作为当下人工智能的产物,又分为语义识别和说话人识别。顾名思义,语义识别是让机器听懂人说了什么话,而说话人识别是让机器辨别出说话人的身份。本文就是结合了两者进行藏语安多方言的相关研究,在基于HTK(Hidden Markov Model Toolkit)平台中的隐马尔科夫模型(Hidden Markov Model,HMM)让机器识别说话人身份的同时还要识别出语义的内容。首先对说话人进行录音,建立语料库,然后将语料进行预处理,接着对语音信号进行特征分析,提取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC),建立HMM。再将建立好的模型与特征参数进行匹配,认为最高的概率值所代表的含义即为说话人的身份和语义的内容。本文主要研究工作如下所示:1.建立藏语安多方言语料库。对于藏语安多方言,实验室目前没有语料库,因此本文随机选取了6位藏语安多方言说话人,分别为4男2女,年龄在18-20岁,总计录制60句话120个词。建立好的语句、孤立词被分别用来说话人识别和语义识别。紧接着对语料进行预处理。2.提取特征参数。对于说话人识别,将预处理后的语音信号进行声学分析,提取特征参数,本文选择了说话人识别中常用到的特征参数MFCC。而对于语义识别,由于本文研究的是藏语安多方言,因此藏文转写、建立语法词典、语音标注是实验顺利进行的前提。3.建立模型库。将训练阶段提取出的特征参数分别建立说话人模型库和语义模型库,然后与识别阶段的特征参数进行概率比对,选出最大值,得出识别结果,然后将每次实验说话人的识别结果与语义的识别结果进行统计,得出两者同时识别出结果的双重识别率。实验表明,识别出说话人的平均识别率为71.9%,识别出语义的平均识别率为88.3%,最终同时识别出两者的平均识别率为58.4%。
【图文】:

框图,框图


说话人识别系统框图

滤波器组,三角,带通滤波器,传递函数


图 3.3Mel 三角滤波器组 3.3 中可以观察到在其中共安放了 n 个带通滤波器(Band Pass Filte f ( m )为中心频率,,每一个 BPF 的传递函数为:0 ( 1)k f m
【学位授予单位】:西北师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34

【参考文献】

相关期刊论文 前10条

1 齐耀辉;潘复平;葛凤培;颜永红;;鉴别性最大后验概率线性回归说话人自适应研究[J];北京理工大学学报;2015年09期

2 孙健;;基于MATLAB的语音信号时频分析研究[J];电脑知识与技术;2015年16期

3 程红伟;陶俊勇;蒋瑜;陈循;;基于高斯混合模型的非高斯随机振动幅值概率密度函数[J];振动与冲击;2014年05期

4 黎林;朱军;;基于小波分析与神经网络的语音端点检测研究[J];电子测量与仪器学报;2013年06期

5 王钟斐;王彪;;基于短时能量—LPCC的语音特征提取方法研究[J];计算机与数字工程;2012年11期

6 肖东;莫福源;陈庚;马力;;混合激励线性预测语音编码标准中线谱频率量化的研究[J];应用声学;2012年02期

7 李冠宇;孟猛;;藏语拉萨话大词表连续语音识别声学模型研究[J];计算机工程;2012年05期

8 李冠宇;;隐马尔可夫模型及其在语音识别中的应用[J];科技风;2011年23期

9 徐坤玉;张彩珍;药雪崧;;语音信号的加窗傅里叶变换研究[J];山西师范大学学报(自然科学版);2011年03期

10 崔宣;孙华;刘浏;;基于SVM-GMM混合模型的说话人辨认研究[J];西华大学学报(自然科学版);2010年01期

相关会议论文 前2条

1 刘静萍;德熙嘉措;;安多藏语辅音识别的设计[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

2 李洪波;于洪志;;藏语语音识别的预处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

相关博士学位论文 前1条

1 王智国;嵌入式人机语音交互系统关键技术研究[D];中国科学技术大学;2014年

相关硕士学位论文 前10条

1 潘怡霖;基于i-vector特征规整的概率线性判别分析说话人确认方法研究[D];哈尔滨工业大学;2017年

2 朱虹;基于Kinect的特定说话人跟踪系统的研究与实现[D];延边大学;2017年

3 张帅林;基于HMM的关键词语音识别技术在智能家居中的应用研究[D];兰州交通大学;2017年

4 赵存成;在线式开集说话人识别系统的设计与实施[D];北京邮电大学;2017年

5 于云;基于非重构压缩采样的抗噪说话人识别技术研究[D];南京邮电大学;2016年

6 李青龙;基于码本聚类优化的VQ说话人识别SOPC设计[D];齐齐哈尔大学;2016年

7 薛帅强;基于文本无关的说话人识别技术的研究[D];西南科技大学;2016年

8 张文克;融合LPCC和MFCC特征参数的语音识别技术的研究[D];湘潭大学;2016年

9 马倩倩;基于个性特征的语音转换技术研究[D];河北经贸大学;2013年

10 李旭飞;说话人识别在身份认证中的应用研究[D];西安电子科技大学;2013年



本文编号:2628605

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2628605.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户95a69***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com