当前位置:主页 > 科技论文 > 软件论文 >

弱标注文本的情感分类技术研究

发布时间:2017-12-29 07:13

  本文关键词:弱标注文本的情感分类技术研究 出处:《南京大学》2016年硕士论文 论文类型:学位论文


  更多相关文章: 情感分类 半监督学习 词向量 神经网络


【摘要】:伴随着Web技术的蓬勃发展,以及各类社会媒体的发展。随之而产生的用户评论信息也与日俱增。然而,面对海量的互联网评论信息,传统的社会学分析方法很难从中快速提取出准确的情感信息。文本情感分类(sentiment classification)技术就是利用计算机的强大计算能力,从海量评论文本信息中快速获取有价值的情感信息。在文本情感分类中,为了提高分类准确度,往往需要学习大量的标注样本来获取分类模型。但是,实际中我们通常只能获得各种未标注样本。本文首先基于文本内容利用启发式算法生成文本弱标注,从而得到有价值的弱标注文本。再利用半监督学习方法和深度学习方法训练分类模型。本文的主要贡献总结如下:1.综述了目前文本情感分析的研究现状。本文首先介绍了文本情感分类的基本概念和研究进展,然后详细介绍了基于文本特征的情感分类和基于神经网络的情感分类。2.提出了一种基于最大情感置信度的self-training方法,并对该方法进行了实证研究。一种半监督的情感分类方法,通过引入情感语义值和情感分类值,并根据二者计算情感置信度。利用self-training方法,以情感置信度为选择标准,挑选出的情感置信度高的未标注样本进行学习,从而得到准确度更高的分类器。实验结果表明,基于最大情感置信度的self-training方法有效利用了未标注的样本,在分类效果上远远优于传统的半监督学习方法。3.提出了一种基于文本弱标注的词嵌入训练方法LAWE (Label Leveraged Word Embedding),并对该方法进行了实证研究。一种深度学习的情感分类方法,首先在经典的无监督神经网络模型的基础上,引入情感领域的弱标注,通过对大量未标注样本的学习,使得模型训练出的词嵌入包含情感领域信息;然后基于训练出的词嵌入获取文本的特征表示;最后,利用分类器在验证集上验证,并根据验证结果控制LAWE网络的训练周期,从而确定最优的词嵌入训练结果。实验结果验证了LAWE方法的有效性,在同类型方法比较中,该方法获得了较好的分类效果。4.分析并总结了基于最大情感置信度的self-training方法和基于文本弱标注的词嵌入训练方法LAWE的关联与区别。相同之处在于二者都是基于文本内容利用启发式算法生成文本弱标注。不同之处在于,基于最大情感置信度的self-training方法具有速度快、效率高的特点,但较多地依赖于提取的文本特征;而基于文本弱标注的词嵌入训练方法LAWE能够实现自动化地提取文本的特征,但有着运行速度慢、效率低的特点。
[Abstract]:......
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期

相关会议论文 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

相关博士学位论文 前10条

1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年

10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年

相关硕士学位论文 前10条

1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年

2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年

3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年

4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年

6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年

7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年

8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年

10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年



本文编号:1349269

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1349269.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户711ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com