匹配追踪说话人自适应方法
本文选题:说话人 + 自适应方法 ; 参考:《声学学报》2014年04期
【摘要】:针对现有子空间自适应方法无法确定最佳说话人子空间的问题,提出一种基于匹配追踪的说话人自适应方法。将说话人自适应视为一种高维信号的稀疏分解问题,利用本征音和参考说话人超矢量的各自优势联合构造说话人字典;依据匹配追踪原理,通过迭代优化,以后验方式确定最佳说话人子空间维数及其基矢量。引入冗余基矢量检测与去除机制以保证算法的稳定性,并通过快速递推算法得到新说话人坐标。基于汉语连续语音识别的有监督说话人自适应实验结果表明,与本征音及参考说话人加权方法相比,平均有调音节正识率相对提高了1.9%。
[Abstract]:In order to solve the problem that the existing subspace adaptive methods can not determine the optimal subspace of the speaker, a speaker adaptive method based on matching tracking is proposed. The speaker adaptation is regarded as a sparse decomposition problem of high-dimensional signal. The speaker dictionary is constructed by using the respective advantages of intrinsic sound and reference speaker supervector, and is optimized by iteration according to the matching tracing principle. A posteriori method is used to determine the dimension of the optimal speaker subspace and its basis vector. The redundant basis vector detection and removal mechanism is introduced to ensure the stability of the algorithm, and the new speaker coordinates are obtained by a fast recursive algorithm. The experimental results of supervised speaker adaptation based on Chinese continuous speech recognition show that compared with the intrinsic tone and reference speaker weighting method, the average correct recognition rate of tonal syllable is improved by 1.9%.
【作者单位】: 解放军信息工程大学信息系统工程学院;
【基金】:国家自然科学基金(61175017) 国家高技术研究发展计划(863)(2012AA011603)资助
【分类号】:TN912.3
【参考文献】
相关期刊论文 前1条
1 李虎生,刘加,刘润生;语音识别说话人自适应研究现状及发展趋势[J];电子学报;2003年01期
【共引文献】
相关期刊论文 前10条
1 朱浩冰;郭东辉;;声纹识别系统原理及其关键技术[J];计算机安全;2007年09期
2 张文林;牛铜;张连海;李弼程;;基于最大似然可变子空间的快速说话人自适应方法[J];电子与信息学报;2012年03期
3 余姗姗;张亚琼;;语音识别的自适应研究[J];福建电脑;2011年06期
4 倪建克;曾虹;张翔;;基于最大均值似然判决规则的说话人辨认研究[J];杭州电子科技大学学报;2006年05期
5 王坚;;基于说话人聚类的说话人自适应[J];计算机与信息技术;2007年07期
6 黄盈椿;王欢良;冯涛;;应用MAP方差估计的话者自适应训练方法[J];计算机工程;2006年20期
7 李财莲;赵小阳;王丽娟;岳振军;;说话人识别中关键技术的现状与发展[J];军事通信技术;2005年02期
8 雷建军;杨震;刘刚;郭军;;噪声鲁棒语音识别研究综述[J];计算机应用研究;2009年04期
9 魏星;周萍;;语音识别系统及其特征参数的提取研究[J];计算机与现代化;2009年09期
10 张文林;张卫强;刘加;李弼程;屈丹;;一种新的基于子空间的说话人自适应方法[J];自动化学报;2011年12期
相关会议论文 前2条
1 陈江;杨鉴;徐永华;;基于发音词典自适应的纳西语口音汉语普通话语音识别[A];第二十九届中国控制会议论文集[C];2010年
2 熊军军;马瑞堂;李成荣;;儿童语音识别的研究现状[A];第九届全国人机语音通讯学术会议论文集[C];2007年
相关博士学位论文 前6条
1 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
2 沈海峰;语音识别中的环境补偿研究[D];北京邮电大学;2006年
3 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
4 雷建军;噪声鲁棒语音识别中若干问题的研究[D];北京邮电大学;2007年
5 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
6 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年
相关硕士学位论文 前10条
1 吴荣娣;基于特征分类直方图均衡的鲁棒性语音识别研究[D];苏州大学;2010年
2 韦丽兴;采用脉冲耦合神经网络的有噪特定人语音识别系统研究[D];广东工业大学;2011年
3 张俊如;双模态车载语音指令识别系统在线学习方法[D];华南理工大学;2011年
4 杨丹;基于DSP的助残智能语音识别及控制系统[D];长春理工大学;2011年
5 徐炼东;语音识别在访问控制的应用[D];电子科技大学;2011年
6 吴艳艳;孤立词语音识别的关键技术研究[D];青岛大学;2012年
7 余浩;说话人识别的自适应算法研究[D];武汉理工大学;2005年
8 周祖洋;基于VxWorks平台的人声识别技术的研究[D];哈尔滨工程大学;2005年
9 方鹤鹤;基于人耳听觉特性的语音特征提取研究[D];西北大学;2006年
10 曾海涛;说话人识别的研究与DSP实现[D];西南交通大学;2006年
【二级参考文献】
相关期刊论文 前1条
1 李虎生,杨明杰,刘润生;汉语数码语音识别自适应算法[J];电路与系统学报;1999年02期
【相似文献】
相关期刊论文 前10条
1 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期
2 夏菁,尹俊勋,黄建成,黄锋;基于正弦加噪声模型的说话人转换方法[J];电声技术;2005年02期
3 岳喜才,伍晓宇,郑崇勋;用神经阵列网络进行文本无关的说话人识别[J];声学学报(中文版);2000年03期
4 彭煊,王炳锡;基于高斯混合模型差别度量的说话人聚类[J];计算机工程与应用;2005年05期
5 杜江,朱柯;智能麦克风阵列语音分离和说话人跟踪技术研究[J];电子学报;2005年02期
6 宁飞,陈频;说话人识别的几种方法[J];电声技术;2001年12期
7 杨毅明;陈东华;;一种实时说话人身份识别系统的设计[J];华侨大学学报(自然科学版);2009年05期
8 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
9 罗骏,欧智坚,王作英;说话人自适应训练方法在连续语音识别中的应用[J];中文信息学报;2004年03期
10 陈景东,姚磊,黄泰翼;几种高鲁棒性通道及说话人自适应语音识别算法研究[J];声学学报(中文版);1998年06期
相关会议论文 前10条
1 林会杰;贾珈;王晓慧;蔡莲红;;基于B/S模式的3D双语虚拟说话人的研究与实现[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 刘大力;赵力;;与文本无关说话人识别系统的性能比较[A];2004年全国物理声学会议论文集[C];2004年
3 尹巧萍;赵力;;利用语音基音统计特征的说话人性别判识的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
4 蒋冬梅;赵荣椿;;基于尺度描述的说话人归一化语音特征[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
5 欧贵文;邓英;;基于说话人的对话语音分割[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
6 王洪海;刘刚;郭军;;基于二次弯折函数的频率弯折方法[A];第二十六届中国控制会议论文集[C];2007年
7 屈丹;魏鑫;王炳锡;;说话人归一化技术用于语言辨识系统[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
8 李稀敏;洪青阳;黄晓丹;;基于分层结构的文本相关说话人识别算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 金乃高;侯刚;王学辉;李非墨;;基于主动感知的音视频联合说话人跟踪方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
10 周瑜;金怡珠;李桂莲;;基于HMM-BIC的说话人日志系统[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
相关重要报纸文章 前7条
1 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
2 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
3 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
4 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
5 清华大学 刘加;语音识别应用促进技术发展[N];计算机世界;2006年
6 IBM中国研究中心 秦勇;IBM电话语音技术及其应用(一)[N];光明日报;2000年
7 ;人机对话无障碍[N];中国计算机报;2002年
相关博士学位论文 前10条
1 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
2 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年
3 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
4 潘逸倩;声纹密码技术研究[D];中国科学技术大学;2012年
5 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
6 金乃高;音视频联合说话人定位与跟踪方法研究[D];大连理工大学;2008年
7 王志锋;基于信道信息的数字音频盲取证关键问题研究[D];华南理工大学;2013年
8 吴强;基于听觉感知与张量模型的鲁棒语音特征提取方法研究[D];上海交通大学;2010年
9 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
10 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年
相关硕士学位论文 前10条
1 陆亮;多信道条件下的说话人认证[D];北京邮电大学;2010年
2 张力;说话人分段与聚类技术研究[D];解放军信息工程大学;2012年
3 高娅;说话人转变检测的研究与实现[D];南京邮电大学;2013年
4 赵洪刚;基于对话型语音的说话人在线识别技术研究[D];黑龙江大学;2010年
5 毛永刚;基于相关向量机的说话人判别研究[D];电子科技大学;2012年
6 徐晨;基于支持向量机的说话人辨别研究[D];陕西师范大学;2013年
7 陈芝;基于人工神经网络模型的说话人转换算法研究[D];南京邮电大学;2011年
8 张琪;复杂环境下特定说话人的语音识别研究[D];武汉纺织大学;2012年
9 凌锦雯;基于多特征的说话人分割与聚类的研究[D];中国科学技术大学;2011年
10 吴亮春;基于小波变换的说话人语音特征研究[D];西华大学;2010年
,本文编号:1938253
本文链接:https://www.wllwen.com/kejilunwen/wltx/1938253.html