基于表示学习的情感分析关键技术研究
本文关键词:基于表示学习的情感分析关键技术研究 出处:《哈尔滨工业大学》2017年博士论文 论文类型:学位论文
【摘要】:文本情感分析技术可以挖掘互联网文本中蕴含的情感信息,使我们高效的了解人们针对某实体的观点,并根据这些观点做出决策。然而当今互联网应用中的文本特点却对传统情感分析技术形成了挑战:首先,无标注文本的数量越来越多,标注文本却始终稀缺,如何利用无标注数据提高情感分析方法的性能,是目前亟待解决的问题;此外,文本变得简洁且随意,这使得基于词袋的传统特征面临严重的稀疏性问题;另外,不同应用场景的互联网产品层出不穷,针对性的特征工程耗时较长,难以适应快速迭代的文本的分析需求。词向量特征(即词的分布式特征表示)可利用无监督方法训练得到,可以有效利用大量无标注数据;相似的词对应的词向量相似,因而,词向量作为特征可以起到平滑的作用,缓解稀疏性问题;基于深度神经网络的方法可以组合词向量,自动学习文本的抽象表示,无需耗费人力设计特征。因而,基于分布式特征表示和深度神经网络的表示学习技术,具有解决文本情感分析所面临的一系列问题的潜力。论文主要研究如何利用表示学习技术解决情感分析中的若干关键问题。具体的,我们研究了利用含有门控操作的循环神经网络组合模型进行句子表示、句子序列的表示、词表示的方法以及词表示的改进策略,并将其应用于情感分析中的句子情感极性分类、情感表达抽取、情感对象属性抽取和多轮对话中的情绪预测四个任务。本文的主要内容包括以下四个方面。针对互联网短文本表达多样且规范性差带来的极性分类特征稀疏问题,本文提出了利用基于门控操作的循环网络组合模型进行情感语义表示学习的方法,并利用情感信息的抽象表示进行情感极性分类。实验表明,这一方法可以有效识别文本的极性类别。此外,文本对网络训练过程中的词向量变化进行了研究,并结合长短时记忆单元的内部结构,对二者协同作用,模拟词与词间交互的机制进行了探讨。文本中的情感表达方式多种多样,难以总结其共性,隐式的情感表达往往不含情感词,更不易被传统的词袋特征所覆盖,且现有表示学习方法灵活性不足。为了解决这一问题,本文提出了基于长短时记忆网络的序列标注方法,以学习词的抽象语义表示,进而完成识别和抽取。实验表明,通过引入双向连接网络结构,长短时记忆网络可以有效提高情感表达的抽取性能。此外,还针对长短时记忆网络有能力进行信号分离和信息选择的特点进行了研究,探讨了该结构在序列标注过程中的优势。情感对象的属性识别与候选文本中的词的联系密切,因而,词向量的质量直接影响着抽取的性能,但词向量作为词的分布式表示,本身存在诸多问题:其向量表示与对应词的功能间存在鸿沟,统计信息缺失,且具有意义上和功能上的歧义性。为解决这些问题,论文针对性的引入了基于依存句法的词向量和基于外积矩阵的扩展方法,并提出了基于长短时记忆单元特化输入门的词向量特化策略。实验表明,这些方法能够有效改善词向量,并提高属性抽取模型的性能。发现人机多轮对话中的用户负面情绪,可以为对话技术的评价和改进提供依据。然而,现有人机交互的方式使得我们难以直接获得用户的负面反馈。通过多轮对话的上下文预测用户的情绪则是获得此类信息的一种方法。我们对多轮对话的已知句子中可能影响用户情绪的多种因素提出假设,并针对性的建立了神经网络模型学习这些因素的抽象表示,用以预测用户的情绪反馈。实验结果表明,基于卷积循环神经网络的方法可以有效表示多轮对话中的文本序列和关系序列,从而并对用户情绪做出有效预测。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.1
【相似文献】
中国期刊全文数据库 前10条
1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期
2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
中国重要会议论文全文数据库 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
中国博士学位论文全文数据库 前10条
1 王鑫;基于表示学习的情感分析关键技术研究[D];哈尔滨工业大学;2017年
2 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
3 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
4 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
5 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
6 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
7 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
8 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
9 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
10 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
中国硕士学位论文全文数据库 前10条
1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
,本文编号:1312204
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1312204.html