基于隐性特征提取的产品评论挖掘
发布时间:2021-05-10 23:48
随着互联网技术的发展,网络不可避免地成为了一个巨大的信息集合场所,储存着大量有价值的信息,其中就包含了海量的非结构化信息。信息资源的充分利用过程中,不可缺少的一部分就是将非结构化信息转化为结构化信息,产品评论挖掘就是其中一种。然而目前的产品评论挖掘大部分是基于显性特征的分析,对于隐性特征的分析还不是很成熟。因此本文在考虑隐性特征提取的基础上完成产品评论挖掘任务,从电商网络平台中爬取茶叶评论数据,发掘其中隐藏的有价值的信息。本文首先通过对堆叠降噪自编码器进行无监督的逐层预训练与有监督的微调过程,构建显性特征提取模型,完成产品特征集合的构建;随后通过建立评论语料库的CBOW模型,构建隐性特征提取模型,将未包含显性特征的评论充分利用;其次,在基于现有词典的基础上,利用双向传播法,对现有的情感词典进行扩充;然后,以点互信息作为量化指标,完成对各特征-情感词关联对的量化,以及对产品特征的整体评价;最后对计算的得分进行分析,展现产品评论挖掘的实际价值。
【文章来源】:西南财经大学四川省 211工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 产品特征提取
1.2.2 特征-情感词关联对提取
1.2.3 情感分析
1.2.4 深度学习在产品评论挖掘中的应用
1.3 本文主要研究内容
1.4 论文组织结构以及创新点
1.5 本章小结
2 相关技术与理论
2.1 相关概念定义
2.2 文本表示方法
2.2.1 One-Hot编码
2.2.2 向量空间模型
2.2.3 Word2vec语言模型
2.3 堆叠降噪自编码器
2.3.1 自动编码器
2.3.2 堆叠自动编码器
2.3.3 堆叠降噪自编码器
2.4 点互信息
2.5 本章小结
3 模型构建
3.1 特征提取
3.1.1 基于SdA构建的显性特征提取模型
3.1.2 基于CBOW构建的隐性特征提取模型
3.2 情感词典构造
3.2.1 构建基础词典
3.2.2 基于双向循环的词典更新
3.3 情感分析
3.3.1 特征-情感词关联对提取
3.3.2 情感得分计算
3.4 本章小结
4 实验及分析
4.1 实验准备
4.1.1 数据来源及预处理
4.1.2 评价指标
4.2 特征提取
4.2.1 人工特征提取
4.2.2 显性特征提取
4.2.3 隐性特征提取
4.3 情感分析
4.3.1 情感词典构建
4.3.2 情感得分计算
4.4 本章小结
5 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
本文编号:3180289
【文章来源】:西南财经大学四川省 211工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 产品特征提取
1.2.2 特征-情感词关联对提取
1.2.3 情感分析
1.2.4 深度学习在产品评论挖掘中的应用
1.3 本文主要研究内容
1.4 论文组织结构以及创新点
1.5 本章小结
2 相关技术与理论
2.1 相关概念定义
2.2 文本表示方法
2.2.1 One-Hot编码
2.2.2 向量空间模型
2.2.3 Word2vec语言模型
2.3 堆叠降噪自编码器
2.3.1 自动编码器
2.3.2 堆叠自动编码器
2.3.3 堆叠降噪自编码器
2.4 点互信息
2.5 本章小结
3 模型构建
3.1 特征提取
3.1.1 基于SdA构建的显性特征提取模型
3.1.2 基于CBOW构建的隐性特征提取模型
3.2 情感词典构造
3.2.1 构建基础词典
3.2.2 基于双向循环的词典更新
3.3 情感分析
3.3.1 特征-情感词关联对提取
3.3.2 情感得分计算
3.4 本章小结
4 实验及分析
4.1 实验准备
4.1.1 数据来源及预处理
4.1.2 评价指标
4.2 特征提取
4.2.1 人工特征提取
4.2.2 显性特征提取
4.2.3 隐性特征提取
4.3 情感分析
4.3.1 情感词典构建
4.3.2 情感得分计算
4.4 本章小结
5 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
本文编号:3180289
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3180289.html
最近更新
教材专著