半监督判别分析的跨库语音情感识别
本文关键词:半监督判别分析的跨库语音情感识别
更多相关文章: 语音情感识别 判别分析 训练样本 投影方向 测试样本 Berlin 散度 样本间 分类器 特征向量
【摘要】:针对训练样本与测试样本来自不同语音情感数据库造成特征向量空间分布不匹配的问题,采用半监督判别分析减小二者的差异。首先寻找有标签的训练样本和来自另一个库的部分无标签训练样本之间的最优投影方向。基于一致性假设即相近的点更有可能具有相同的类别,利用p近邻图对无标签训练样本相近点之间的关系进行建模,从而获得无标签样本的分布信息。在保证无标签样本间流形结构的同时,使所有训练样本类间散度和类内散度的比值达到最大,从而得到最优的投影方向。采用两组实验进行验证,第1组用eNTERFACE库训练去测试Berlin库,识别率为51.41%,第2组用Berlin库训练测试eNTERFACE库,识别率为45.76%,相比未采用半监督判别分析的识别结果分别有了13.72%和22.81%的提高,说明该算法的有效性。通过实验前后数据的可视化分析,说明利用半监督判别分析确实减小了不同库之间特征向量空间分布的不匹配问题,从而提高跨库语音情感识别率。
【作者单位】: 江苏师范大学物理与电子工程学院;东南大学水声信号处理教育部重点实验室;东南大学儿童发展与学习科学教育部重点实验室;
【关键词】: 语音情感识别;判别分析;训练样本;投影方向;测试样本;Berlin;散度;样本间;分类器;特征向量;
【基金】:国家自然科学基金(61231002,61273266,11274144,61301295) 江苏高校优势学科建设工程项目(PAPD)资助
【分类号】:TN912.34
【正文快照】: 据库同时训练,得到一个分类器,然后对测试样本进^-兰 行分类。结果表明,第2种方法的识别率高于第1种91 3 方法。Zhang提出了一种无监督的学习方法用于跨库语音情感识别在人机交互中起到越来越重要的的语音情感识别,采用6个语音库’从唤^度和效作用,获得越来越多国内外研究人员
【参考文献】
中国期刊全文数据库 前10条
1 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
2 黄程韦;赵艳;金峗;于寅骅;赵力;;实用语音情感的特征分析与识别的研究[J];电子与信息学报;2011年01期
3 韩文静;李海峰;韩纪庆;;基于长短时特征融合的语音情感识别方法[J];清华大学学报(自然科学版);2008年S1期
4 金峗;赵艳;黄程韦;赵力;;耳语音情感数据库的设计与建立[J];声学技术;2010年01期
5 ;Study on automatic prediction of sentential stress for Chinese Putonghua Text-to-Speech system with natural style[J];Chinese Journal of Acoustics;2007年01期
6 ;Whispered speaker identification based on feature and model hybrid compensation[J];Chinese Journal of Acoustics;2012年04期
7 TAO Zhi;ZHAO Heming;TAN Xuedan;GU Jihua;ZHANG Xiaojun;WU Di;;Conversion from whispered speech to normal speech using the extended bilinear transformation method[J];Chinese Journal of Acoustics;2013年04期
8 CHEN Xueqin;ZHAO Heming;;Research of whispered speech vocal tract system conversion based on universal background model and effective Gaussian components[J];Chinese Journal of Acoustics;2013年04期
9 ZHOU Jian;ZHENG Wenming;WANG Qingyun;ZHAO Li;;Intelligibility enhancement for noisy whispered speech using asymmetric cost function[J];Chinese Journal of Acoustics;2014年03期
10 ZHANG Xiaodan;HUANG Chengwei;ZHAO Li;ZOU Cairong;;Recognition of practical speech emotion using improved shuffled frog leaping algorithm[J];Chinese Journal of Acoustics;2014年04期
【共引文献】
中国期刊全文数据库 前10条
1 郑微;李正周;田蕾;;基于DSP的智能语音控制系统设计[J];传感器与微系统;2012年02期
2 任培花;孙宏志;;基于言语过滤、情感补偿的活体声纹识别系统的设计[J];重庆科技学院学报(自然科学版);2007年01期
3 陈清;;英语儿歌中的语言象似性特征研究[J];长沙铁道学院学报(社会科学版);2009年01期
4 林奕琳;韦岗;杨康才;;语音情感识别的研究进展[J];电路与系统学报;2007年01期
5 余伶俐;蔡自兴;陈明义;;语音信号的情感特征分析与识别研究综述[J];电路与系统学报;2007年04期
6 狄金海;赵艳;赵力;;模糊矢量量化在语音情感识别中的应用[J];电声技术;2008年10期
7 国辛纯;郭继昌;窦修全;;基于HMM的语音信号情感识别研究[J];电子测量技术;2006年05期
8 卞金洪;王吉林;;利用性别判识技术的说话人识别系统的研究[J];信息化研究;2011年01期
9 余华;徐开军;;基于模糊集理论的语音情感识别[J];信息化研究;2011年02期
10 张石清;李乐民;赵知劲;;基于一种改进的监督流形学习算法的语音情感识别[J];电子与信息学报;2010年11期
中国重要会议论文全文数据库 前8条
1 李雅;潘诗锋;陶建华;;采用重音调整模型的HMM语音合成系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
2 陈雁翔;;汉语情感语音数据库的设计与测试[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 张立华;杨莹春;;情感语音变化规律的实验分析研究初步[A];第九届全国人机语音通讯学术会议论文集[C];2007年
4 韩文静;李海峰;韩纪庆;;基于长短时特征融合的语音情感识别方法研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
5 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
6 李悦;黄永明;章国宝;刘海彬;;基于角度差和散度均值特征的人脸表情识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
7 张卫;张雪英;孙颖;;基于HHT边际Teager能量谱的语音情感识别[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
8 高莹莹;朱维彬;;汉语朗读语音中言语情感产生机制与计算模型研究——阶段性结果[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
2 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
3 刘伟锋;人脸表情识别研究[D];中国科学技术大学;2007年
4 金学成;基于语音信号的情感识别研究[D];中国科学技术大学;2007年
5 孙爱珍;计算文体学工作模式探究[D];河南大学;2008年
6 孙伟;基于粒子滤波的视频目标跟踪关键技术及应用研究[D];西安电子科技大学;2009年
7 孙凯;面向观众的电影情感内容表示与识别方法研究[D];华中科技大学;2009年
8 谢s,
本文编号:805342
本文链接:https://www.wllwen.com/kejilunwen/wltx/805342.html