细粒度中文网络消费评论情感极性分类方法研究
本文关键词:细粒度中文网络消费评论情感极性分类方法研究
更多相关文章: 细粒度 情感词 属性词 LDA主题模型 情感极性分类
【摘要】:近年来,随着电子商务和各种类型互联网互动社区的同步快速发展,网络消费评论信息,形成了具有重要商业价值的大数据集。网络商品评论的情感分析技术能够从主观性文本中识别、抽取相关的倾向性信息,通过特定算法以量化形式描述出文本所表达的主观意见,借此推测出评论者对所购买商品或服务的喜好程度,能够影响消费者的决策行为,对于改进商品特性、精准推送商品信息也具有重要的指导意义。为使情感分析的效用更加精准的作用于某一属性之上,以最大发挥消费评论的商业价值,本文开展网络消费评论分析中情感词与属性词的自动提取算法,以及基于情感词与属性词分析的细粒度网络消费评论情感极性分类方法研究。本文首先利用网络爬虫技术抓取了网络餐饮消费评论作为语料库,借助机器学习、自然语言处理等领域的理论知识,结合中文网络评价语言表达方式的特点,提出一种基于语料的领域情感词库自动构建方法;结合了餐饮评论中情感词与属性词之间的特征分析,提出基于名词+LDA(Latent Dirichlet Allocation)和基于字词间距+LDA+情感词库两种属性词搜寻策略,并对方法和策略的有效性进行了实验验证和实验结果分析;构建情感评价单元,根据情感评价单元进行情感计算,依据计算得分实现细粒度的文本情感分析,将细粒度情感分析结果以图形化层次结构进行了输入显不。通过本文的研究能够进一步提高用户评论情感分析的精确性,并使其在产品或服务改进、消费决策过程中发挥更大的指导作用。
【关键词】:细粒度 情感词 属性词 LDA主题模型 情感极性分类
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 绪论10-23
- 1.1 论文的研究背景及意义10-11
- 1.2 国内外研究现状11-21
- 1.2.1 文本分类技术研究11-15
- 1.2.2 情感分类技术研究15-21
- 1.2.3 存在的问题和挑战21
- 1.3 论文的主要研究内容与章节安排21-23
- 1.3.1 论文主要研究内容21-22
- 1.3.2 论文的组织结构22-23
- 第2章 相关知识介绍与研究方案设计23-29
- 2.1 中文自然语言处理相关知识23-25
- 2.1.1 中文分词23-24
- 2.1.2 中文词性标注24-25
- 2.1.3 中文分词系统25
- 2.2 情感词与属性词的搭配抽取25-27
- 2.2.1 情感词与属性词25-26
- 2.2.2 情感词与属性词的搭配抽取26-27
- 2.3 研究方案设计27-28
- 2.3.1 总体研究过程框架27
- 2.3.2 研究方案设计说明27-28
- 2.4 本章小结28-29
- 第3章 基于语料的领域情感词库构建方法29-40
- 3.1 领域情感词库构建总体过程框架29-30
- 3.2 领域情感词库结构设计30-31
- 3.3 语料选取与预处理31-33
- 3.3.1 语料选取31-32
- 3.3.2 语料预处理32-33
- 3.4 领域基准情感词集构建33-38
- 3.4.1 基于公共词典库的领域基础标准情感词集构建34-35
- 3.4.2 基于词性特征的语料库种子情感词提取35-37
- 3.4.3 基于点互信息(PMI)的语料库情感词自动扩充37-38
- 3.5 实验与分析38-39
- 3.5.1 实验结果38-39
- 3.5.2 结果分析39
- 3.6 本章小结39-40
- 第4章 基于LDA主题模型的属性词提取方法40-50
- 4.1 方法概述40-42
- 4.1.1 LDA主题模型简介40-41
- 4.1.2 基于LDA主题模型的属性词提取策略41-42
- 4.2 实验方案设计42-47
- 4.2.1 实验流程设计42-43
- 4.2.2 领域语料库基准属性词集构建43-44
- 4.2.3 准属性词集筛选44-47
- 4.3 实验结果分析47-49
- 4.4 本章小结49-50
- 第5章 面向评价属性的细粒度文本情感分析实现50-58
- 5.1 方法概述50-51
- 5.2 情感评价单元构建51-55
- 5.2.1 情感评价单元定义51
- 5.2.2 断句处理算法51-53
- 5.2.3 程度副词、否定词提取53-55
- 5.3 情感聚合与情感倾向分类计算55
- 5.4 实验结果可视化表示55-57
- 5.5 本章小结57-58
- 第6章 总结与展望58-60
- 6.1 总结58
- 6.2 展望58-60
- 参考文献60-67
- 致谢67-68
- 作者简介68
【相似文献】
中国期刊全文数据库 前10条
1 许璐蕾;;网络评论中情感词的获取及极性判断方法比较[J];电脑与电信;2011年01期
2 肖健;徐建;朱姝;万缨;许亮;;基于翻译和语义方法的情感词挖掘研究[J];计算机工程与应用;2011年32期
3 赵鹏;赵志伟;卓景文;;一种情感词语义加权的句子倾向性识别方法[J];计算机工程与应用;2011年35期
4 代大明;李寿山;李培峰;朱巧明;;基于情绪词与情感词协作学习的情感分类方法研究[J];计算机科学;2012年12期
5 李勇敢;周学广;孙艳;张焕国;;结合依存关联分析和规则统计分析的情感词库构建方法[J];武汉大学学报(理学版);2013年05期
6 彭庆喜;钱铁云;;基于量化情感的网店垃圾评论检测[J];山东大学学报(理学版);2013年11期
7 杜嘉忠;徐健;刘颖;;网络商品评论的特征 情感词本体构建与情感分析方法研究[J];现代图书情报技术;2014年05期
8 张清亮;徐健;;网络情感词自动识别方法研究[J];现代图书情报技术;2011年10期
9 黄俊;田生伟;禹龙;冯冠军;;基于维吾尔语情感词的句子情感分析[J];计算机工程;2012年09期
10 孙劲光;马志芳;孟祥福;;基于情感词属性和云模型的文本情感分类方法[J];计算机工程;2013年12期
中国重要会议论文全文数据库 前5条
1 陈奇哲;刘全升;姚天f ;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
3 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最优的情感标签图像自动标注算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 王枞;涂序彦;刘嘉;;注意-情绪协调的个性化信息推荐模型[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 刘全超;面向中文微博的观点挖掘与倾向性分析研究[D];北京理工大学;2015年
2 董喜双;基于免疫多词主体自治学习的情感分析研究[D];哈尔滨工业大学;2013年
3 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
4 杨玉珍;基于Web评论信息的倾向性分析关键技术研究[D];山东师范大学;2014年
5 黄胜;Web评论文本的细粒度意见挖掘技术研究[D];北京理工大学;2014年
6 施寒潇;细粒度情感分析研究[D];苏州大学;2013年
7 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
8 李芳;面向中文Web评论的观点挖掘关键技术研究[D];华中师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙博;关于情感词的意义用法[D];辽宁大学;2012年
2 王银;中文微博情感分析方法研究[D];广东技术师范学院;2015年
3 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年
4 杜雪峰;藏文句子倾向性分析研究[D];中央民族大学;2015年
5 孙建超;微博舆情挖掘技术的研究与应用[D];电子科技大学;2015年
6 张圣声;基于微博平台的产品评论情感分类研究[D];广东外语外贸大学;2015年
7 何天翔;基于情感词网的短文本情感分类方法研究[D];西南科技大学;2015年
8 丁星;基于文本倾向性分析技术的微博监控系统[D];江苏科技大学;2015年
9 李茜;博客意见检索关键问题研究[D];北京理工大学;2015年
10 李瑞静;汉语情感词模糊语义的量化分析及应用研究[D];北京理工大学;2015年
,本文编号:931141
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/931141.html