基于深度学习的大同方言语音情感识别
发布时间:2021-08-02 01:37
我国历史文化悠久,在五千年的历史长河中,各个地区形成了自己区域独特的方言,这些方言都是我国的文化瑰宝。大同方言是中国七大方言区之一的北方方言,研究大同方言对研究北方方言有重要意义,本文主要针对大同方言的语音情感进行研究。方言语音情感识别研究起步较晚和技术不成熟等客观原因,使大同方言语音情感识别研究成果匮乏,尤其在语料库资源上,比较空白。但是社会潜在需求较大、研究潜在价值颇高。研究大同方言对保护我国非物质文化遗产有着重要意义,在大同方言研究的基础上,未来可对山西方言的研究,甚至对全国方言、世界方言的研究有积极作用。本文主要工作内容如下:(1)构建了大同方言语音离散情感语料库。该工作主要包括文本语料库的收集、整理和校对;语音的收集、预处理(降噪、标注)以及整理,完成11678千多个大同句子录音,对所得语音数据进行人工扩充和预处理,最终完成12000个可利用的语音样本数据。(2)对比不同特征集在大同方言情感语料库情感识别上的准确率,使用传统机器学习方法进行识别,与传统方法提取的情感特征对比。实验结果说明了IS09,IS10,ComParE特征集在大同方言上的有效性,且为后续实验特征选择做出参...
【文章来源】:中北大学山西省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
普通话语音与大同话语音对比
中北大学学位论文4性。(5)在服务业上,二十一世纪以来,人工智能技术飞速发展,智能客户服务技术逐渐成熟,已经可以为人们解决生活中的不少问题。而大同方言语音情感识别可以帮助大同用户提升体验,监督人工客服态度,代替人工客服解决民生问题,释放冗余人力。这些行业几乎囊括了日常生活的方方面面,随着社会的进步,大同方言语音情感识别研究会有越来越重要的理论价值,值得学者们进行更深层的研究和探索。同时该研究也有很高的应用价值,可以为人们生活的方方面面提供便利;研究大同方言对保护我国非物质文化遗产有着重要意义,在大同方言研究的基础上,可对山西方言的研究,甚至全国乃至全世界方言的研究都有积极促进作用。上述用户需求和研究意义,都为大同方言语音情感识别的研究奠定了基矗目前在国外,已有很多成熟的外语语音情感识别系统问世。在国内,普通话语音情感识别技术也取得了非常显著的研究成果,但是在大同方言语音情感识别方面,研究仍然有很大的发展空间。1.2语音情感识别总体流程方言语音情感识别首先要建立方言语音情感语料库,在语音数据转化为数字信号后,先经过预处理,对处理过的数字信号进行特征提取,然后对提取的特征进行筛选后再进行情感分类。这五个部分构成一个完整的方言语音情感识别系统。图1-2方言语音情感识别总体流程Fig.1-2Dialectspeechemotionrecognitionoverallprocess
中北大学学位论文6为了减少大量信息的不同特征之间的相关性,提高神经网络模型的学习效率,往往需要对原始数据中的情感表征特征进行筛选,这就是特征选择。在过去,这需要通过精心构造的实际情感特征组合来增加情感的识别率。近年来,大多数特征选择都随着深度学习技术的发展而采用了深度学习神经网络的方法,因为神经网络可以学习更多高级特征,有效的提高情感的识别率。对这一研究内容,将在第四、五章节进行论述。(5)分类器的训练在获取情感表征性信息之后,就是利用模型训练分类器,进行情感分类。情感分类可通过分类和聚类来实现,本文使用分类来实现情感分类。情感识别中运用传统机器学习算法进行分类的方法在处理样本数较少、低纬度特征集的实验中效果更好,运用深度学习的方法进行分类则在应对大量样本数据、高纬度特征集时效果更佳,为了得到更加准确的实验结果,本文将对比大两类算法应用在大同方言语音情感识别技术上的准确率。1.3语音情感识别研究现状1.3.1国内外研究现状语音情感识别主要有特征提取和分类这两个研究方向,经过无数学者在这两个方向不断地探索和研究,近年来取得了不少突破性进展,语音情感识别的准确率提升不少。在特征提取方面,除了上面提到的一些基于共振峰的特征、基于能量的特征以及谱特征的特征提取技术外,还有一些权威专家设计的专门用来实现情感识别的语音信号特征集,后续将会对这些特征集进行汇总介绍。语音经过谱变换后得到结果如图1-3所示。图1-3宽带语谱图Fig.1-3Broadbandspectrum经过不断地探索与发现,越来越多的语音特征被用于语音情感识别。语音特征的选
【参考文献】:
期刊论文
[1]基于RNN的桂柳方言语音识别系统研究[J]. 杨波. 现代计算机. 2019(31)
[2]基于改进BP-Adaboost和HMM混合模型的方言情感识别[J]. 冀常鹏,程琳,李锋. 成都信息工程大学学报. 2019(05)
[3]大同方言“得”字特殊用法研究[J]. 曹婷婷. 吕梁学院学报. 2019(03)
[4]大同方言的“起去”[J]. 张宝. 汉语学报. 2019(01)
[5]离散标签与维度空间结合的语音数据库设计[J]. 陈颖,肖仲喆. 声学技术. 2018(04)
[6]重庆方言语音识别系统的设计与实现[J]. 张策,韦鹏程,陆晓燕,石熙. 计算机测量与控制. 2018(01)
[7]人工智能与语音识别技术[J]. 胡郁. 电子产品世界. 2016(04)
[8]基于情感词典的中文微博情感分析模型研究[J]. 梁亚伟. 现代计算机(专业版). 2015(18)
[9]语音情感识别研究进展综述[J]. 韩文静,李海峰,阮华斌,马琳. 软件学报. 2014(01)
[10]浅谈大同方言的入声[J]. 李伟东. 时代文学(下半月). 2013(04)
硕士论文
[1]基于深度学习的语音情感识别研究[D]. 李鹏程.中国科学技术大学 2019
[2]基于深度学习的语音情感识别建模研究[D]. 何伟.北京邮电大学 2019
[3]基于传统课堂的教师话语情感识别研究[D]. 钱婷.华中师范大学 2019
[4]大同方言声调的实验研究[D]. 庞雅峰.天津师范大学 2016
[5]汉语语音预处理及孤立词识别方法研究[D]. 赫连浩博.山东大学 2007
本文编号:3316625
【文章来源】:中北大学山西省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
普通话语音与大同话语音对比
中北大学学位论文4性。(5)在服务业上,二十一世纪以来,人工智能技术飞速发展,智能客户服务技术逐渐成熟,已经可以为人们解决生活中的不少问题。而大同方言语音情感识别可以帮助大同用户提升体验,监督人工客服态度,代替人工客服解决民生问题,释放冗余人力。这些行业几乎囊括了日常生活的方方面面,随着社会的进步,大同方言语音情感识别研究会有越来越重要的理论价值,值得学者们进行更深层的研究和探索。同时该研究也有很高的应用价值,可以为人们生活的方方面面提供便利;研究大同方言对保护我国非物质文化遗产有着重要意义,在大同方言研究的基础上,可对山西方言的研究,甚至全国乃至全世界方言的研究都有积极促进作用。上述用户需求和研究意义,都为大同方言语音情感识别的研究奠定了基矗目前在国外,已有很多成熟的外语语音情感识别系统问世。在国内,普通话语音情感识别技术也取得了非常显著的研究成果,但是在大同方言语音情感识别方面,研究仍然有很大的发展空间。1.2语音情感识别总体流程方言语音情感识别首先要建立方言语音情感语料库,在语音数据转化为数字信号后,先经过预处理,对处理过的数字信号进行特征提取,然后对提取的特征进行筛选后再进行情感分类。这五个部分构成一个完整的方言语音情感识别系统。图1-2方言语音情感识别总体流程Fig.1-2Dialectspeechemotionrecognitionoverallprocess
中北大学学位论文6为了减少大量信息的不同特征之间的相关性,提高神经网络模型的学习效率,往往需要对原始数据中的情感表征特征进行筛选,这就是特征选择。在过去,这需要通过精心构造的实际情感特征组合来增加情感的识别率。近年来,大多数特征选择都随着深度学习技术的发展而采用了深度学习神经网络的方法,因为神经网络可以学习更多高级特征,有效的提高情感的识别率。对这一研究内容,将在第四、五章节进行论述。(5)分类器的训练在获取情感表征性信息之后,就是利用模型训练分类器,进行情感分类。情感分类可通过分类和聚类来实现,本文使用分类来实现情感分类。情感识别中运用传统机器学习算法进行分类的方法在处理样本数较少、低纬度特征集的实验中效果更好,运用深度学习的方法进行分类则在应对大量样本数据、高纬度特征集时效果更佳,为了得到更加准确的实验结果,本文将对比大两类算法应用在大同方言语音情感识别技术上的准确率。1.3语音情感识别研究现状1.3.1国内外研究现状语音情感识别主要有特征提取和分类这两个研究方向,经过无数学者在这两个方向不断地探索和研究,近年来取得了不少突破性进展,语音情感识别的准确率提升不少。在特征提取方面,除了上面提到的一些基于共振峰的特征、基于能量的特征以及谱特征的特征提取技术外,还有一些权威专家设计的专门用来实现情感识别的语音信号特征集,后续将会对这些特征集进行汇总介绍。语音经过谱变换后得到结果如图1-3所示。图1-3宽带语谱图Fig.1-3Broadbandspectrum经过不断地探索与发现,越来越多的语音特征被用于语音情感识别。语音特征的选
【参考文献】:
期刊论文
[1]基于RNN的桂柳方言语音识别系统研究[J]. 杨波. 现代计算机. 2019(31)
[2]基于改进BP-Adaboost和HMM混合模型的方言情感识别[J]. 冀常鹏,程琳,李锋. 成都信息工程大学学报. 2019(05)
[3]大同方言“得”字特殊用法研究[J]. 曹婷婷. 吕梁学院学报. 2019(03)
[4]大同方言的“起去”[J]. 张宝. 汉语学报. 2019(01)
[5]离散标签与维度空间结合的语音数据库设计[J]. 陈颖,肖仲喆. 声学技术. 2018(04)
[6]重庆方言语音识别系统的设计与实现[J]. 张策,韦鹏程,陆晓燕,石熙. 计算机测量与控制. 2018(01)
[7]人工智能与语音识别技术[J]. 胡郁. 电子产品世界. 2016(04)
[8]基于情感词典的中文微博情感分析模型研究[J]. 梁亚伟. 现代计算机(专业版). 2015(18)
[9]语音情感识别研究进展综述[J]. 韩文静,李海峰,阮华斌,马琳. 软件学报. 2014(01)
[10]浅谈大同方言的入声[J]. 李伟东. 时代文学(下半月). 2013(04)
硕士论文
[1]基于深度学习的语音情感识别研究[D]. 李鹏程.中国科学技术大学 2019
[2]基于深度学习的语音情感识别建模研究[D]. 何伟.北京邮电大学 2019
[3]基于传统课堂的教师话语情感识别研究[D]. 钱婷.华中师范大学 2019
[4]大同方言声调的实验研究[D]. 庞雅峰.天津师范大学 2016
[5]汉语语音预处理及孤立词识别方法研究[D]. 赫连浩博.山东大学 2007
本文编号:3316625
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3316625.html