基于LDA主题模型的在线评论聚类分析与推荐
发布时间:2021-11-24 15:28
随着信息技术的发展,网购平台中涌现出海量的在线评论,其中蕴含着丰富的产品信息,消费者如何在海量的文本中快速查阅到自身感兴趣的信息成为一个棘手的问题。基于文本的聚类方法是缓解该问题的重要途径,具有广阔的应用前景。电子商务环境下的在线评论具有质量参差不齐、短文本特征稀疏、描述信息能力较弱等特点,这造成文本的主题模糊和内容混乱,制约了在线评论的应用发展。而文本聚类可以揭示文本内容的一致性,从而发现同一类别中所包含的共同信息,有助于在线评论的重新组织和二次应用。为此,本文的重点研究内容为在线评论的聚类分析和评论的推荐方法,旨在找出在线评论短文本中最合适的聚类模型,同时通过选取重要评论和富有情感倾向的评论辅助消费者更有效的获取信息。本文的主要研究内容如下:1.针对传统向量空间模型忽略深层次语义信息的问题,提出使用LDA(Latent Dirichlet Allocation)主题模型进行在线评论的向量化表示,并探究在.LDA模型下最合适的短文本聚类方法。实验结果表明,通过LDA模型能准确的捕获评论中主题信息,使得聚类结果更加合理。并且在各个聚类算法中,基于图分割的谱聚类算法综合表现最好。2.为提...
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.2 主要研究内容与论文组织结构
1.2.1 主要研究内容
1.2.2 论文组织结构
1.3 本章小结
2 相关文献综述
2.1 电商环境下在线评论的相关研究综述
2.1.1 在线评论的有用性分析
2.1.2 基于标签化的评论推荐
2.1.3 在线评论的情感值计算方法
2.1.4 在线评论中主题模型的应用
2.1.5 在线评论中聚类方法的应用价值
2.2 本章小结
3 基于LDA主题模型的在线评论聚类模型
3.1 文本表示模型
3.1.1 向量空间模型
3.1.2 主题模型
3.2 LDA主题模型相关工作
3.2.1 文本建模
3.2.2 LDA吉布斯采样(Gibbs Sampling)
3.3 经典的聚类算法
3.3.1 K-means算法
3.3.2 DBSCAN算法
3.3.3 谱聚类算法
3.3.4 经典聚类算法的分析与比较
3.4 基于LDA算法的聚类模型构建
3.5 实验与分析
3.5.1 实验数据集
3.5.2 评价指标
3.5.3 实验结果分析
3.5.3.1 不同数据集上LDA算法的对比分析
3.5.3.2 不停数据集上K-means、DBCSAN及谱聚类方法的效果比较
3.6 本章小结
4 在线评论复杂网络的构建及评论推荐
4.1 在线评论无向网络模型构建
4.2 在线评论节点重要度计算
4.2.1 基于度中心性的节点重要性计算
4.2.2 社区划分下的节点重要度计算
4.3 实验与分析
4.3.1 复杂网络统计性质分析
4.3.2 评论推荐结果分析
4.4 本章小结
5 在线评论情感倾向性计算及评论推荐
5.1 文本情感计算方法简介
5.1.1 基于情感词典的情感计算方法
5.1.2 无监督情感计算方法
5.1.3 基于有监督的文本情感计算方法
5.2 基于多特征融合与集成学习的文本情感计算
5.2.1 文本特征选择
5.2.2 集成学习
5.3 实验与分析
5.3.1 实验数据集
5.3.2 实验评价指标
5.3.3 实验结果分析
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
【参考文献】:
期刊论文
[1]基于DBSCAN算法的文本聚类研究[J]. 邹艳春. 软件导刊. 2016(08)
[2]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[3]在线评论对消费者购买意愿的影响——心理距离的中介作用[J]. 周梅华,李佩镅,牟宇鹏. 软科学. 2015(01)
[4]基于句法特征的评价对象抽取方法研究[J]. 戴敏,王荣洋,李寿山,朱珠,周国栋. 中文信息学报. 2014(04)
[5]在线负面评论对网络消费者购买意愿的影响[J]. 宁连举,孙韩. 技术经济. 2014(03)
[6]基于LDA的网络评论主题发现研究[J]. 阮光册. 情报杂志. 2014(03)
[7]文本聚类算法综述[J]. 史梦洁. 现代计算机(专业版). 2014(03)
[8]文本谱聚类算法研究[J]. 施晓筛,徐森,曹瑞. 电子设计工程. 2012(22)
[9]在线商品评论的效用分析研究[J]. 杨铭,祁巍,闫相斌,李一军. 管理科学学报. 2012(05)
[10]基于浅层句法特征的评价对象抽取研究[J]. 徐冰,赵铁军,王山雨,郑德权. 自动化学报. 2011(10)
博士论文
[1]基于产品评论的情感分析研究[D]. 李方涛.清华大学 2011
硕士论文
[1]基于主题模型的用户兴趣建模及在新闻推荐中的应用[D]. 陈铭权.华南理工大学 2015
[2]电子商务网站在线评论有用性研究[D]. 汪俊奎.西安电子科技大学 2014
本文编号:3516254
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.2 主要研究内容与论文组织结构
1.2.1 主要研究内容
1.2.2 论文组织结构
1.3 本章小结
2 相关文献综述
2.1 电商环境下在线评论的相关研究综述
2.1.1 在线评论的有用性分析
2.1.2 基于标签化的评论推荐
2.1.3 在线评论的情感值计算方法
2.1.4 在线评论中主题模型的应用
2.1.5 在线评论中聚类方法的应用价值
2.2 本章小结
3 基于LDA主题模型的在线评论聚类模型
3.1 文本表示模型
3.1.1 向量空间模型
3.1.2 主题模型
3.2 LDA主题模型相关工作
3.2.1 文本建模
3.2.2 LDA吉布斯采样(Gibbs Sampling)
3.3 经典的聚类算法
3.3.1 K-means算法
3.3.2 DBSCAN算法
3.3.3 谱聚类算法
3.3.4 经典聚类算法的分析与比较
3.4 基于LDA算法的聚类模型构建
3.5 实验与分析
3.5.1 实验数据集
3.5.2 评价指标
3.5.3 实验结果分析
3.5.3.1 不同数据集上LDA算法的对比分析
3.5.3.2 不停数据集上K-means、DBCSAN及谱聚类方法的效果比较
3.6 本章小结
4 在线评论复杂网络的构建及评论推荐
4.1 在线评论无向网络模型构建
4.2 在线评论节点重要度计算
4.2.1 基于度中心性的节点重要性计算
4.2.2 社区划分下的节点重要度计算
4.3 实验与分析
4.3.1 复杂网络统计性质分析
4.3.2 评论推荐结果分析
4.4 本章小结
5 在线评论情感倾向性计算及评论推荐
5.1 文本情感计算方法简介
5.1.1 基于情感词典的情感计算方法
5.1.2 无监督情感计算方法
5.1.3 基于有监督的文本情感计算方法
5.2 基于多特征融合与集成学习的文本情感计算
5.2.1 文本特征选择
5.2.2 集成学习
5.3 实验与分析
5.3.1 实验数据集
5.3.2 实验评价指标
5.3.3 实验结果分析
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
【参考文献】:
期刊论文
[1]基于DBSCAN算法的文本聚类研究[J]. 邹艳春. 软件导刊. 2016(08)
[2]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[3]在线评论对消费者购买意愿的影响——心理距离的中介作用[J]. 周梅华,李佩镅,牟宇鹏. 软科学. 2015(01)
[4]基于句法特征的评价对象抽取方法研究[J]. 戴敏,王荣洋,李寿山,朱珠,周国栋. 中文信息学报. 2014(04)
[5]在线负面评论对网络消费者购买意愿的影响[J]. 宁连举,孙韩. 技术经济. 2014(03)
[6]基于LDA的网络评论主题发现研究[J]. 阮光册. 情报杂志. 2014(03)
[7]文本聚类算法综述[J]. 史梦洁. 现代计算机(专业版). 2014(03)
[8]文本谱聚类算法研究[J]. 施晓筛,徐森,曹瑞. 电子设计工程. 2012(22)
[9]在线商品评论的效用分析研究[J]. 杨铭,祁巍,闫相斌,李一军. 管理科学学报. 2012(05)
[10]基于浅层句法特征的评价对象抽取研究[J]. 徐冰,赵铁军,王山雨,郑德权. 自动化学报. 2011(10)
博士论文
[1]基于产品评论的情感分析研究[D]. 李方涛.清华大学 2011
硕士论文
[1]基于主题模型的用户兴趣建模及在新闻推荐中的应用[D]. 陈铭权.华南理工大学 2015
[2]电子商务网站在线评论有用性研究[D]. 汪俊奎.西安电子科技大学 2014
本文编号:3516254
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3516254.html