基于统计方法的中文短文本情感分析
本文关键词:基于统计方法的中文短文本情感分析
更多相关文章: 自然语言处理 情感分析 情感词典 支持向量机 卷积神经网络
【摘要】:近些年来,文本的情感分析作为自然语言处理领域中一项重要的研究问题受到了广泛的关注。随着互联网的飞速发展,情感分析技术在舆情监控、事件预测等领域发挥着越来越重要的作用。本文针对中文短文本,以商品评论文本为例,设计了基于统计方法的情感分析方法。本文分别使用支持向量机和卷积神经网络作为分类器,结合扩充后的情感词典改进了文本的表示模型,进一步提高了情感分析的准确率。本文最后将两种机器学习方法进行了对比,分别说明了各自的优势。本文的主要工作和研究内容如下:第一,情感词典是情感分析的基础,本文设计了一种扩充情感词典的方法。该方法主要有以下几个步骤:从互联网抓取大量文本数据、对文本数据进行新词发现和分词操作、训练word2vec词向量模型、利用词向量模型得到已有情感词语的相关词、利用《同义词词林(扩展版)》进行进一步筛选。情感词典的词汇量在扩充后有了较大的提高。第二,使用支持向量机对文本进行了情感分析。采用向量空间模型将文本转化为向量的形式,并且使用扩充后的情感词典对向量的部分特征权重进行改进,使用支持向量机对文本向量进行分类,实验结果证明了改进的有效性。第三,使用卷积神经网络对文本进行了情感分析。采用word2vec词向量模型将文本转化为矩阵的形式,并且根据扩充后的情感词典向文本矩阵添加情感信息维,使用卷积神经网络对文本矩阵进行预测,实验结果证明了改进方案在一定程度上的有效性。最后对比了支持向量机和卷积神经网络两种模型,分别说明了各自的优势。
【关键词】:自然语言处理 情感分析 情感词典 支持向量机 卷积神经网络
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-16
- 1.1 本文的研究背景和意义10-11
- 1.2 国内外研究现状11-14
- 1.2.1 基于统计方法的研究现状12-13
- 1.2.2 基于规则和语义方法的研究现状13-14
- 1.3 主要研究内容和创新点14-15
- 1.4 论文结构及安排15-16
- 第2章 文本情感分析关键技术16-23
- 2.1 情感分析概念与分类16-17
- 2.1.1 基本概念16
- 2.1.2 分类16-17
- 2.2 分词和新词发现技术17-18
- 2.3 文本的向量空间模型18-19
- 2.4 文本分类19-22
- 2.4.1 基于浅层学习的文本分类20-21
- 2.4.2 基于深度学习的文本文类21-22
- 2.5 本章小结22-23
- 第3章 情感词典的扩充23-36
- 3.1 情感词典23-24
- 3.2 词典扩充工具介绍24-27
- 3.2.1Word2vec介绍24-25
- 3.2.2 同义词扩展工具25-26
- 3.2.3 语义相似度计算26-27
- 3.3 情感词典扩充流程27-34
- 3.3.1 数据抓取27-28
- 3.3.2 新词发现和分词28-32
- 3.3.3 训练词向量模型32
- 3.3.4 获得情感词的相关词语32-33
- 3.3.5 同义词筛选33-34
- 3.4 本章小结34-36
- 第4章 基于支持向量机的情感分析36-50
- 4.1 构建特征词表36-41
- 4.1.1 文本预处理36-39
- 4.1.2 特征选择39-41
- 4.2 文本的向量表示41-45
- 4.2.1 特征权重的计算41-44
- 4.2.2 引入情感加强因子44-45
- 4.3 分类模型的训练45
- 4.4 实验及结果分析45-49
- 4.4.1 评价指标45-46
- 4.4.2 实验数据46
- 4.4.3 实验及分析46-49
- 4.5 本章小结49-50
- 第5章 基于卷积神经网络的情感分析50-68
- 5.1 人工神经网络50-54
- 5.1.1 神经元50-51
- 5.1.2 神经网络51-53
- 5.1.3 多层感知机53-54
- 5.2 卷积神经网络54-55
- 5.2.1 局部连接54-55
- 5.2.2 权值共享55
- 5.3 情感分析具体过程55-62
- 5.3.1 评论文本的表示57-58
- 5.3.2 引入情感信息维58
- 5.3.3 卷积神经网络构建58-62
- 5.4 实验及分析62-66
- 5.4.1 评价指标62
- 5.4.2 实验数据62
- 5.4.3 实验及分析62-65
- 5.4.4 深度学习与浅层学习的实验结果对比65-66
- 5.5 本章小结66-68
- 结论68-69
- 参考文献69-74
- 攻读学位期间发表论文与研究成果清单74-75
- 致谢75
【相似文献】
中国期刊全文数据库 前10条
1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期
中国重要会议论文全文数据库 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
中国博士学位论文全文数据库 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
中国硕士学位论文全文数据库 前10条
1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
,本文编号:724621
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/724621.html