基于机器学习的outlier分析与在线汽车评论挖掘研究
发布时间:2020-11-22 04:21
对信息过载的Web2.0背景下的电子商务而言,如何处理大量的网络口碑(Online WOM),快速准确获取帮助顾客做出满意购买决策或是帮助供应商改进产品和服务的知识日益成为业界和学界关注的焦点。论文围绕这种需求,选择高价值、专业化且尚无成熟互联网销售模式的汽车商品作为研究对象,以奥迪Q5的网络口碑数据为例,主要解决三个具体问题:1)作为具体的,较为成熟的一型产品,奥迪Q5的产品优势和劣势各是什么?2)在线口碑是否能反映顾客在购买及使用产品过程中的真实情感,如果可以,怎样刻画?3)如何在这些口碑数据中找到离群点,并分析这些点的特征和形成机制以产生异类知识?全文逻辑如下:首先,原始数据经过NLP过程,所有产品属性以顾客集体意见倾向性排序,明晰了产品的优劣势,与此同时,也产生了进一步研究所需要的基础数据集。此外,面对目前学界对网络口碑有用性的争论,论文强调网络口碑只有反映顾客在购买和使用产品过程中的真实情感才有价值。据此,论文利用回答第一个问题时产生的形式为{意见持有者,产品属性,分句,极性}的基础数据集,设计了个人差评度和修正个人差评度两个指标。进而由多重线性回归找到了在线评论刻画顾客真实情感的方法。这证明论文由在线评论数据明晰的产品优劣势是可靠的,同时也为后文构建有效坐标空间,进而发现异类知识做了准备。最后,论文以outlier视角对口碑数据在“个人—集体意见”和“评论—评价”两个坐标空间内实施了例外挖掘,尝试梳理outlier样本的特征以获取异类知识。论文主要的实践贡献在于明晰了奥迪Q5不同维度的产品优劣势,为顾客购买决策和供应商改进产品提供了有益参考。另外,研究从outlier视角,发现异类口碑的不满情绪与汽车油耗高度正相关,为从业者探索新的顾客行为规律提供了可能。,论文的主要理论贡献在于:管理视角下,以通用的知识发现框架为基础,综合成熟的离群点检测和知识分类提出了网络口碑异类知识发现过程。技术视角下,论文设计的以产品属性的集体差评度作为权重,代替修饰词典参与到个人评论情感计算的方法能够在降低情感计算主观性的同时,显著且稳定的刻画顾客的真实情感。
【学位单位】:武汉纺织大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F416.471
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究内容及方法
1.2.1 研究内容
1.2.2 研究方法
1.3 论文创新点
2 国内外相关研究文献回顾
2.1 意见挖掘的主要技术
2.1.1 意见挖掘的概念与任务
2.1.2 意见挖掘的特征抽取技术
2.1.3 意见挖掘的情感分类技术
2.2 网络口碑价值研究
2.3 异类知识发现
2.3.1 知识的概念与分类
2.3.2 异类(outlier)与异类知识发现
2.4 本章小结
3 基于网络口碑的产品优劣势挖掘
3.1 数据采集
3.2 产品特征抽取
3.3 产品优劣势挖掘及其可视化
3.3.1 评论文本的情感分类
3.3.2 产品优劣势测度及其可视化
3.4 本章小结
4 在线评论与评价的关系模型
4.1 在线评论情感的测度
4.2 在线评论与评价的多重线性回归
4.3 本章小结
5 网络口碑的异类检测与知识发现
5.1 网络口碑异类知识发现的框架构建
5.2 网络口碑异类知识发现的实现
5.2.1 汽车网络口碑的离群点(outlier)检测
5.2.2 汽车网络口碑离群点(outlier)评估与解释
5.3 本章小结
6 研究结论与展望
参考文献
附录
附录Ⅰ
附录Ⅱ 攻读硕士学位期间参加的科研项目
附录Ⅲ 论文撰写过程中用到的代码
致谢
【参考文献】
本文编号:2894113
【学位单位】:武汉纺织大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F416.471
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究内容及方法
1.2.1 研究内容
1.2.2 研究方法
1.3 论文创新点
2 国内外相关研究文献回顾
2.1 意见挖掘的主要技术
2.1.1 意见挖掘的概念与任务
2.1.2 意见挖掘的特征抽取技术
2.1.3 意见挖掘的情感分类技术
2.2 网络口碑价值研究
2.3 异类知识发现
2.3.1 知识的概念与分类
2.3.2 异类(outlier)与异类知识发现
2.4 本章小结
3 基于网络口碑的产品优劣势挖掘
3.1 数据采集
3.2 产品特征抽取
3.3 产品优劣势挖掘及其可视化
3.3.1 评论文本的情感分类
3.3.2 产品优劣势测度及其可视化
3.4 本章小结
4 在线评论与评价的关系模型
4.1 在线评论情感的测度
4.2 在线评论与评价的多重线性回归
4.3 本章小结
5 网络口碑的异类检测与知识发现
5.1 网络口碑异类知识发现的框架构建
5.2 网络口碑异类知识发现的实现
5.2.1 汽车网络口碑的离群点(outlier)检测
5.2.2 汽车网络口碑离群点(outlier)评估与解释
5.3 本章小结
6 研究结论与展望
参考文献
附录
附录Ⅰ
附录Ⅱ 攻读硕士学位期间参加的科研项目
附录Ⅲ 论文撰写过程中用到的代码
致谢
【参考文献】
相关期刊论文 前10条
1 赵冠哲;齐建鹏;于彦伟;刘兆伟;宋鹏;;移动社交网络异常签到在线检测算法[J];智能系统学报;2017年05期
2 郑大庆;范颖捷;潘蓉;蔡会明;;大数据治理的概念与要素探析[J];科技管理研究;2017年15期
3 唐晓波;刘广超;;细粒度情感分析研究综述[J];图书情报工作;2017年05期
4 陈龙;管子玉;何金红;彭进业;;情感分类研究进展[J];计算机研究与发展;2017年06期
5 张艳辉;李宗伟;赵诣成;;基于淘宝网评论数据的信息质量对在线评论有用性的影响[J];管理学报;2017年01期
6 何有世;李娜;;搜索型商品评论有用性影响因素研究[J];情报杂志;2016年12期
7 奚雪峰;周国栋;;面向自然语言处理的深度学习研究[J];自动化学报;2016年10期
8 夏火松;甄化春;张颖烨;杨培;;线上商品评论有效性分类专业领域知识模型的构建研究[J];情报学报;2016年09期
9 许红艳;郭红;;无线传感器网络节点故障诊断算法研究[J];西南师范大学学报(自然科学版);2016年09期
10 张艳丰;李贺;彭丽徽;;基于模糊情感计算的商品在线评论用户品牌转换意向研究[J];现代图书情报技术;2016年05期
相关博士学位论文 前1条
1 韩开旭;基于支持向量机的文本情感分析研究[D];东北石油大学;2014年
相关硕士学位论文 前1条
1 龙瑾;在线评论异类知识管理研究[D];武汉纺织大学;2017年
本文编号:2894113
本文链接:https://www.wllwen.com/kejilunwen/qiche/2894113.html
最近更新
教材专著