当前位置:主页 > 科技论文 > 信息工程论文 >

面向中文语音情感识别的改进栈式自编码结构

发布时间:2018-01-14 20:26

  本文关键词:面向中文语音情感识别的改进栈式自编码结构 出处:《东南大学学报(自然科学版)》2017年04期  论文类型:期刊论文


  更多相关文章: 语音情感识别 改进的栈式自编码 降噪自编码 稀疏自编码


【摘要】:为进一步提高汉语语音情感识别率,基于深度学习中的自编码、降噪自编码及稀疏自编码的网络结构,提出了一种改进的栈式自编码结构.该结构第1层使用降噪自编码学习一个比输入特征维数更大的隐藏特征,第2层采用稀疏自编码学习稀疏性特征,最后使用softmax分类器进行分类识别.训练过程首先采用逐层预训练的方法,达到网络参数全面初始化的目的,然后对整个网络进行微调.在中文语音库上的情感识别实验显示,相较于单独使用栈式降噪或稀疏自编码,所提结构具有更好的识别效果.此外,基于CASIA库的对比实验显示,该结构比K近邻算法、稀疏表示方法、传统支持向量机和人工神经网络识别率分别提高了53.7%,29.8%,14.3%和1.9%.在自行录制的语音库中,该结构的识别率比人工神经网络提高了1.64%.
[Abstract]:In order to improve the emotion recognition rate of Chinese speech, the network structure is based on self-coding, de-noising self-coding and sparse self-coding in depth learning. An improved stack self-coding structure is proposed, in which layer 1 uses noise reduction self-coding to learn a hidden feature with larger dimension than input feature, and layer 2 uses sparse self-coding to learn sparse feature. Finally, the softmax classifier is used for classification recognition. Firstly, the method of pre-training layer by layer is used in the training process to achieve the goal of the overall initialization of network parameters. Then the whole network is fine-tuned. The experiment of emotion recognition on Chinese speech corpus shows that the proposed structure has better recognition effect than using stack noise reduction or sparse self-coding alone. The contrast experiments based on CASIA library show that the recognition rate of this structure is increased by 53.7% than that of K-nearest neighbor algorithm, sparse representation method, traditional support vector machine and artificial neural network, respectively. In the self-recorded corpus, the recognition rate of the structure is 1.64% higher than that of artificial neural network.
【作者单位】: 东南大学水声信号处理教育部重点实验室;南京工程学院通信工程学院;
【基金】:国家自然科学基金资助项目(61375028,61571106,61673108) 江苏省青蓝工程资助项目 江苏省博士后科研资助计划资助项目(1601011B) 江苏省“六大人才高峰”资助项目(2016-DZXX-023) 中国博士后科学基金资助项目(2016M601695)
【分类号】:TN912.34
【正文快照】: 语音是人机交互最自然友好的方式之一,承载着说话人丰富的情感信息.但如今的人机交互并不能像人与人交流那样自由,其原因是机器不能像人一样判断对方话语中的情感.语音情感识别在人工智能领域有着非常广阔的未来,其终极目标是让机器能够像人类一样通过语音识别人类情感,实现更

【参考文献】

相关期刊论文 前3条

1 张昕然;查诚;徐新洲;宋鹏;赵力;;基于LDA+kernel-KNNFLC的语音情感识别方法[J];东南大学学报(自然科学版);2015年01期

2 韩文静;李海峰;;情感语音数据库综述[J];智能计算机与应用;2013年01期

3 蒋丹宁;蔡莲红;;基于语音声学特征的情感信息识别[J];清华大学学报(自然科学版);2006年01期

【共引文献】

相关期刊论文 前10条

1 朱芳枚;赵力;梁瑞宇;王青云;邹采荣;;面向中文语音情感识别的改进栈式自编码结构[J];东南大学学报(自然科学版);2017年04期

2 隋小芸;朱廷劭;汪静莹;;基于局部特征优化的语音情感识别[J];中国科学院大学学报;2017年04期

3 张昕然;巨晓正;宋鹏;查诚;赵力;;用于跨库语音情感识别的DBN特征融合方法[J];信号处理;2017年05期

4 张雪英;张婷;孙颖;张卫;畅江;;情感语音数据库优化及PAD情感模型量化标注[J];太原理工大学学报;2017年03期

5 王宝军;薛雨丽;于适宁;毛峡;;多模情感数据库的设计与评价[J];中国科技论文;2016年02期

6 张雪英;孙颖;张卫;畅江;;语音情感识别的关键技术[J];太原理工大学学报;2015年06期

7 王宝军;薛雨丽;于适宁;毛峡;;多模情感数据库的设计与评价[J];中国科技论文;2015年20期

8 孙凌云;何博伟;刘征;杨智渊;;基于语义细胞的语音情感识别[J];浙江大学学报(工学版);2015年06期

9 景少玲;毛峡;陈立江;张娜娜;;汉语双模情感语音数据库标注及一致性检测[J];北京航空航天大学学报;2015年10期

10 魏平杰;樊兴华;;语音倾向性分析中的特征抽取研究[J];计算机应用研究;2014年12期

【二级参考文献】

相关期刊论文 前2条

1 黄程韦;赵艳;金峗;于寅骅;赵力;;实用语音情感的特征分析与识别的研究[J];电子与信息学报;2011年01期

2 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期

【相似文献】

相关期刊论文 前10条

1 赵力;黄程韦;;实用语音情感识别中的若干关键技术[J];数据采集与处理;2014年02期

2 陈建厦,李翠华;语音情感识别的研究进展[J];计算机工程;2005年13期

3 王茜;;一个语音情感识别系统的设计与实现[J];大众科技;2006年08期

4 孙亚;;远程教学中语音情感识别系统的研究与实现[J];长春理工大学学报(高教版);2008年02期

5 章国宝;宋清华;费树岷;赵艳;;语音情感识别研究[J];计算机技术与发展;2009年01期

6 石瑛;胡学钢;方磊;;基于决策树的多特征语音情感识别[J];计算机技术与发展;2009年01期

7 赵腊生;张强;魏小鹏;;语音情感识别研究进展[J];计算机应用研究;2009年02期

8 张石清;赵知劲;;噪声背景下的语音情感识别[J];西南交通大学学报;2009年03期

9 黄程韦;金峗;王青云;赵艳;赵力;;基于特征空间分解与融合的语音情感识别[J];信号处理;2010年06期

10 袁健;贺祥;许华虎;冯肖维;刘玲;;服务机器人的语音情感识别与交互技术研究[J];小型微型计算机系统;2010年07期

相关会议论文 前8条

1 陈建厦;;语音情感识别综述[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年

2 杨桃香;杨鉴;毕福昆;;基于模糊聚类的语音情感识别[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

3 罗武骏;包永强;赵力;;基于模糊支持向量机的语音情感识别方法[A];2012'中国西部声学学术交流会论文集(Ⅱ)[C];2012年

4 王青;谢波;陈根才;;基于神经网络的汉语语音情感识别[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年

5 张鼎天;徐明星;;基于调制频谱特征的自动语音情感识别[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

6 童灿;;基于boosting HMM的语音情感识别[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年

7 戴明洋;杨大利;徐明星;;语音情感识别中UBM训练集的组成研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 张卫;张雪英;孙颖;;基于HHT边际Teager能量谱的语音情感识别[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

相关博士学位论文 前7条

1 孙亚新;语音情感识别中的特征提取与识别算法研究[D];华南理工大学;2015年

2 王坤侠;语音情感识别方法研究[D];合肥工业大学;2015年

3 韩文静;语音情感识别关键技术研究[D];哈尔滨工业大学;2013年

4 谢波;普通话语音情感识别关键技术研究[D];浙江大学;2006年

5 尤鸣宇;语音情感识别的关键技术研究[D];浙江大学;2007年

6 刘佳;语音情感识别的研究与应用[D];浙江大学;2009年

7 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年

相关硕士学位论文 前10条

1 陈晓东;基于卷积神经网络的语音情感识别[D];华南理工大学;2015年

2 孙志锋;语音情感识别研究[D];陕西师范大学;2015年

3 谭发曾;语音情感状态模糊识别研究[D];电子科技大学;2015年

4 陈鑫;相空间重构在语音情感识别中的研究[D];长沙理工大学;2014年

5 李昌群;基于特征选择的语音情感识别[D];合肥工业大学;2015年

6 陈文汐;基于核函数的语音情感识别技术的研究[D];东南大学;2015年

7 薛文韬;基于深度学习和迁移学习的语音情感识别方法研究[D];江苏大学;2016年

8 宋明虎;电力行业电话电话客服语音情感识别[D];昆明理工大学;2016年

9 陈肖;基于多粒度特征融合的维度语音情感识别方法研究[D];哈尔滨工业大学;2016年

10 任浩;基于多级分类的语音情感识别[D];哈尔滨工业大学;2016年



本文编号:1425172

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1425172.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户81dd1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com