基于复杂网络的在线评论情感倾向性分类
本文关键词:基于复杂网络的在线评论情感倾向性分类
【摘要】:随着WEB技术和电子商务平台的迅速发展,网络购物逐渐成为消费者购物的潮流,消费者以在线评论的方式分享自己的购物经历,表达对产品或服务的偏好和体验。这些评论包含了消费者对产品、卖家、厂家、物流等网购环节的情感倾向,对于商家改进产品,提高服务质量,提升客户满意度具有重要的意义,同时对于消费者做出正确的购物决策也有很大的帮助。因此近年来,在线评论情感分析逐渐成为在线评论研究的热点问题,而其中的情感倾向性分类作为情感分析的主要任务逐渐受到关注。本文以在线评论情感倾向性分类的研究为主线,结合复杂网络理论提出新的情感倾向性分类算法。主要从以下三个方面开展本文的研究:首先,针对公共领域情感词典对专业领域词语、网络用语和新兴词语收录不全的问题,提出了将公共情感词典作为种子情感词典,以评论预料库中的形容词且未出现公共情感词典中作为候选情感词,利用信息论中的点互信息理论计算候选情感词和种子情感词的相关度来扩展公共领域情感词典,从而构建专业领域情感词典的算法。其次,针对传统情感分类算法中忽略文档词语语序和缺乏文档句法分析的问题提出了基于有向网络的情感分类模型。该模型根据消费者在线评论,构建评论有向网络,从评论网络的拓扑性质和评论文档的语义内容出发建立在线评论情感倾向性分类模型。首先以词语共现理论为基础构建评论的有向网络,然后挖掘网络中具有情感信息的子网络,将子网络中由程度词和否定词导致的情感偏移引入到韦伯-费希纳定律中,提出了一种新的在线评论情感相似性计算方法DNSA(Directed network and syntactic analysis),利用该方法计算测试评论和训练中评论的相似度,选取相似度最大的前K条评论的多数类作为该评论的情感类别。再次,针对传统的基于词袋模型的情感分类算法中忽略文档特征的语义相关性信息和文档结构信息,造成评论情感资源遗漏的问题,提出了基于复杂网络特征选择的情感倾向性分类模型。首先利用复杂网络理论提出了一种新的情感分类特征选择算法NTFS(Complex network feature selection),该算法通过构建候选情感特征关系网络,利用复杂网络中节点重要性评估理论,考虑节点的局部和全局重要性,提出了利用网络节点的度中心性、接近中心性和介数中心性综合衡量节点重要性来选择情感分类特征的算法,然后结合经典机器学习算法SVM、NB、NNET实现在线评论的情感倾向性分类。最后,为了测试算法,以酒店评论和手机评论为实验数据。通过结果分析,发现这两种情感分类算法可以有效的实现在线评论的情感分类,显著提高情感分类的性能。
【关键词】:复杂网络 情感分类 情感词典 特征选择
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F724.6;F713.55
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-17
- 1.1 研究背景及意义9-11
- 1.2 国内外研究现状11-14
- 1.3 论文组织结构14-17
- 2 相关概念介绍17-30
- 2.1 复杂网络理论17-20
- 2.1.1 复杂网络基础概念17-18
- 2.1.2 节点重要性评估理论18-20
- 2.2 文本情感分类关键技术20-29
- 2.2.1 特征选择20-23
- 2.2.2 文本表示23-24
- 2.2.3 常用分类器24-28
- 2.2.4 分类性能评价28-29
- 2.3 本章小结29-30
- 3 专业领域情感词典构建30-35
- 3.1 情感词典介绍30-31
- 3.2 专业领域情感词典构建31-34
- 3.3 本章小结34-35
- 4 基于有向网络的情感倾向性分类35-43
- 4.1 在线评论词语共现关系及有向网络构建35-37
- 4.2 评论情感相似度计算及情感分类37-39
- 4.3 算例分析39-42
- 4.4 本章小结42-43
- 5 基于复杂网络特征选择的情感倾向性分类43-52
- 5.1 基于复杂网络的情感分类特征选择43-46
- 5.1.1 复杂网络模型构建43-44
- 5.1.2 情感分类特征选择算法44-46
- 5.2 算例分析46-49
- 5.3 两种情感分类算法比较49-51
- 5.4 本章小结51-52
- 结论52-54
- 参考文献54-57
- 攻读硕士学位期间发表学术论文情况57-58
- 致谢58-59
【相似文献】
中国期刊全文数据库 前6条
1 林书亮;;联合L_(2,1)范数正则约束的特征选择方法[J];科技与企业;2013年24期
2 李晓艳;周兴弛;殷海娜;;特征选择在协同过滤推荐算法中的应用研究[J];价值工程;2012年17期
3 朱林婷;丁荣涛;;基于内容的图像检索在电子商务中应用初探[J];商场现代化;2007年33期
4 李晓艳;张子刚;张逸石;;集成k-means聚类和有监督特征选择的混合式协同过滤推荐[J];管理学报;2013年09期
5 吴桂玲;;基于欧氏距离和余弦相似度特征选择的入侵检测模型[J];中小企业管理与科技(上旬刊);2010年02期
6 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 倪友平;王思臣;马桂珍;陈曾平;;分支界定算法在低分辨雷达飞机架次判别中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
6 蒙新泛;王厚峰;;主客观识别中的上下文因素的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 万京;王建东;;一种基于新的差异性度量的ReliefF方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 范丽;许洁萍;;基于GMM的音乐信号音色模型研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
9 陈友;戴磊;程学旗;;基于MRMHC-C4.5的IP流分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 申f;杨宏晖;袁帅;;用于水声目标识别的互信息无监督特征选择[A];第三届上海——西安声学学会学术会议论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 李静;高维数据交互特征选择和分类研究[D];燕山大学;2015年
2 刘风;基于磁共振成像的多变量模式分析方法学与应用研究[D];电子科技大学;2014年
3 王石平;粗糙拟阵及其在高维数据降维中的应用研究[D];电子科技大学;2014年
4 代琨;基于支持向量机的网络数据特征选择技术研究[D];解放军信息工程大学;2013年
5 王爱国;微阵列基因表达数据的特征分析方法研究[D];合肥工业大学;2015年
6 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
7 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年
8 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
9 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
10 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 张金蕾;蛋白质SUMO化修饰位点预测的数据挖掘技术研究[D];西北农林科技大学;2015年
2 史德飞;自适应特征选择在线瓷砖分类系统[D];南京大学;2014年
3 马铮;网络流量特征分析与特征选择[D];北京邮电大学;2013年
4 徐冬;基于特征选择的入侵检测方法研究[D];吉林大学;2016年
5 郑芳泉;稀有数据的集成特征选择与入侵检测[D];福州大学;2013年
6 徐子伟;基于分步特征选择和组合分类器的电信客户流失预测模型[D];中国科学技术大学;2016年
7 肖丽莎;半监督特征选择关键技术研究[D];西南交通大学;2016年
8 李昌;概率特征选择分类向量机[D];中国科学技术大学;2016年
9 黄春虎;基于ReliefF-FCBF组合的入侵特征选择算法研究[D];新疆大学;2016年
10 谭蕴琨;面向稀疏数据的在线学习特征选择方法研究[D];华南理工大学;2016年
本文关键词:基于复杂网络的在线评论情感倾向性分类
,
本文编号:512111
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/512111.html