面向电子商务评论文本的观点挖掘系统研究与实现
本文关键词:面向电子商务评论文本的观点挖掘系统研究与实现,由笔耕文化传播整理发布。
【摘要】:随着Web2.0时代的到来,,互联网上评论信息成几何级数的增长。对于这些文本信息,往往包括用户对某件事物的看法和论断。能够准确高效的识别其评论文本中的观点信息并加以利用,将具有巨大的实际应用和经济价值。 本文首先介绍了观点挖掘的背景意义,概括列举了国内外具有代表性的学者研究情况,然后针对本文所主要解决的三大问题:情感计算、特征挖掘和观点分类汇总,通过研究国内外相关的研究成果,对一些传统算法进行了改进,并提出了一些具有创新性的算法。 (1)在情感计算当中,不仅考虑了分句本身词语对分句情感倾向的作用,同时结合了上下文语境对分句情感倾向的影响,提出了一种基于上下文语境的分句情感倾向推断方法。 (2)在特征属性挖掘中,采用了基于属性词和情感词修饰关系的双向迭代扩展方法,针对中文语言特征,利用临近原则方法获取属性词和情感词的修饰关系。并且通过属性词和情感词之间的修饰关联关系,来发现隐式的属性词。 (3)在观点分类汇总中,利用属性词和情感词的关联关系,对属性词进行加强聚类运算,获得各种粒度上的属性词簇。按照属性词簇的分类以及其他信息,对观点进行分类汇总,获得用户关心的各种主题层面评价信息。 实验结果表明:与传统方法相比,本文提出的相关方法在结果的准确率和召回率上均有较大提高,同时所获取的观点信息能够更加直观具体的为用户服务。
【关键词】:观点挖掘 情感计算 特征挖掘 竞拍规则 双向迭代
【学位授予单位】:浙江理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1
【目录】:
- 摘要4-5
- Abstract5-9
- 第一章 绪论9-19
- 1.1 评论文本观点挖掘的背景和研究意义9-11
- 1.2 亟待解决的几个问题11-13
- 1.2.1 评论文本的情感计算11
- 1.2.2 评论对象特征的挖掘11-12
- 1.2.3 观点的分类与汇总12-13
- 1.3 相关研究综述13-17
- 1.3.1 国外研究概况13-15
- 1.3.2 国内研究概况15-17
- 1.4 本文的组织结构安排17-19
- 第二章 综述19-23
- 2.1 本文研究的对象及特点19
- 2.2 本文主要的研究任务19-21
- 2.3 本文所用到的数据介绍21-23
- 第三章 中文评论文本的情感极性及强度判断23-33
- 3.1 基于情感词典的极性判断23-25
- 3.1.1 分词及词性标注23
- 3.1.2 基于否定词反转语义的情感极性判断法23-24
- 3.1.3 基于 AuctionRules 算法的主要情感计算24-25
- 3.2 基于上下文语境的情感极性计算25-28
- 3.2.1 分句情感强度计算方法25-27
- 3.2.2 上下文语境的情感极性判别27-28
- 3.3 算法步骤详细说明28-30
- 3.4 实验效果分析30-32
- 3.4.1 实验数据介绍30-31
- 3.4.2 P,R,F 评测结果31-32
- 3.5 本章小结32-33
- 第四章 评论文本中评论对象的特征挖掘33-50
- 4.1 基于临近原则的显式评论特征挖掘35-36
- 4.2 隐式特征挖掘的方法36-45
- 4.2.1 双向迭代法构建情感词与属性词间的关联关系37-41
- 4.2.2 基于关联规则的目标特征确定方法41-44
- 4.2.3 缺省属性词的前置推断方法44-45
- 4.3 属性词推断的整体框架及实验分析45-49
- 4.3.1 整体框架45-46
- 4.3.2 实验分析46-49
- 4.4 本章小结49-50
- 第五章 观点的分类汇总及决策支持50-64
- 5.1 数据50-51
- 5.2 整条评论的情感计算问题51-52
- 5.3 属性分类聚类问题52-56
- 5.3.1 相似度计算公式54-55
- 5.3.2 聚类算法55-56
- 5.4 实验结果分析56-63
- 5.4.1 属性词聚类实验结果56-59
- 5.4.2 观点汇总分类实验结果59-63
- 5.5 本章小结63-64
- 第六章 观点挖掘系统的实现64-73
- 6.1 系统总体框架64-65
- 6.2 系统的详细设计65-66
- 6.3 系统实现66-71
- 6.3.1 词表的构建66-67
- 6.3.2 系统实现展示67-71
- 6.4 本章小结71-73
- 第七章 总结与展望73-75
- 7.1 本文工作总结73-74
- 7.2 未来工作展望74-75
- 攻读硕士学位期间主要的研究成果75-76
- 参考文献76-80
- 致谢80-81
【参考文献】
中国期刊全文数据库 前10条
1 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
2 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
3 王国胜;;基于支持向量机的数据挖掘技术[J];德州学院学报;2007年02期
4 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
5 李钝;曹付元;曹元大;万月亮;;基于短语模式的文本情感分类研究[J];计算机科学;2008年04期
6 李艳玲;戴冠中;朱烨行;;基于类别空间模型的文本倾向性分类方法[J];计算机应用;2007年09期
7 刘笛,朱学峰,苏彩红;一种新型的模糊C均值聚类初始化方法[J];计算机仿真;2004年11期
8 袁军鹏;朱东华;李毅;李连宏;黄进;;文本挖掘技术研究进展[J];计算机应用研究;2006年02期
9 李实;叶强;李一军;罗嗣卿;;挖掘中文网络客户评论的产品特征及情感倾向[J];计算机应用研究;2010年08期
10 吴晓彦;郑骁庆;顾轶灵;沈元一;;基于结构语义熵的网上商品信息提取系统[J];计算机应用与软件;2010年09期
中国硕士学位论文全文数据库 前5条
1 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
2 李本阳;句子和篇章文本倾向分析[D];哈尔滨工业大学;2010年
3 张紫琼;面向中文情感分析的词类组合模式研究[D];哈尔滨工业大学;2007年
4 戴臻;内容文本分类中的语义特征提取算法研究[D];中南大学;2010年
5 梁伟明;中文关键词提取技术[D];上海交通大学;2010年
本文关键词:面向电子商务评论文本的观点挖掘系统研究与实现,由笔耕文化传播整理发布。
本文编号:316099
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/316099.html