基于情感分析的商品评价系统设计与实现
发布时间:2021-04-01 08:00
网络购物在方便人们生活的同时,也存在着一些问题,由于网络购物不能像线下购物一样能够接触到商品,而且商品的所有信息都是由商家所给出的,这就造成了信息的不对等,容易导致用户买到了假货、残次品、或与自己期望不符的商品,造成一定的损失。虽然用户可以通过查看商品评论来获取有价值的信息,但随着商品评论的不断的累积,这种信息获取方式的效率越来越低。针对商品评论累积过多的问题,重点是从海量的商品评论中提取出有价值的信息,本文通过对现有情感分析方法进行研究,设计并实现了基于情感词典和基于SVM的商品评价系统,利用情感分析方法对商品评论进行分析处理,向用户提供客观且全面的购物参考信息。本文主要工作体现在以下方面:(1)数据的采集。本文通过对电商平台页面进行分析,设计了基于Scrapy框架的网络爬虫,该网络爬虫能够从电商平台上爬取相应商品的各项信息。本文利用该网络爬虫从电商平台累积收集了数十万条数据。(2)情感分析方法的研究。为了从商品评论中挖掘出有价值的信息,本文对现有情感分析方法进行研究,采用了基于情感词典和基于SVM这两种情感分析方法对商品评论进行处理。在情感词典方法的研究中,本文以通用情感词典为基础...
【文章来源】:河北工程大学河北省
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
京东源码截图
第3章基于Scrapy框架的数据采集23图3-7京东源码截图Fig.3-7JDsourcecodescreenshot通过同样的分析方法,可以发现淘宝用于存储商品评论的文件为包含有list_detail的文件,商品评论的URL同样可以在headers中找到,如图3-8所示。图3-8淘宝源码截图Fig.3-8screenshotofTaobaosourcecode在对其他笔记本电脑进行同样的分析后,可以发现这些用于存储商品评论的URL的区别仅在于商品的ID不同,所以本文依此构造了商品评论的初始URL,并通过更改URL中的商品ID来构造出相应商品评论的URL。获取评论的URL后,就可分析电商平台返回的数据来制定相应的爬虫规则来获取评论内容、评分等信息。本文以京东商城的返回数据为例进行分析,如图3-9所示,可以发现返回的响应数据是json格式的数据,所以可以通过查找数据中的key来获取对应的数据,其中存放评论的key是content,存放评论创建时间的是creationTime,存放用户评分的是score。因此通过遍历数据中的content、createTime、score来获取到相应的数据。图3-9京东响应数据截图Fig.3-9JDresponsedatascreenshot
第3章基于Scrapy框架的数据采集23图3-7京东源码截图Fig.3-7JDsourcecodescreenshot通过同样的分析方法,可以发现淘宝用于存储商品评论的文件为包含有list_detail的文件,商品评论的URL同样可以在headers中找到,如图3-8所示。图3-8淘宝源码截图Fig.3-8screenshotofTaobaosourcecode在对其他笔记本电脑进行同样的分析后,可以发现这些用于存储商品评论的URL的区别仅在于商品的ID不同,所以本文依此构造了商品评论的初始URL,并通过更改URL中的商品ID来构造出相应商品评论的URL。获取评论的URL后,就可分析电商平台返回的数据来制定相应的爬虫规则来获取评论内容、评分等信息。本文以京东商城的返回数据为例进行分析,如图3-9所示,可以发现返回的响应数据是json格式的数据,所以可以通过查找数据中的key来获取对应的数据,其中存放评论的key是content,存放评论创建时间的是creationTime,存放用户评分的是score。因此通过遍历数据中的content、createTime、score来获取到相应的数据。图3-9京东响应数据截图Fig.3-9JDresponsedatascreenshot
【参考文献】:
期刊论文
[1]商品评论情感倾向性分析[J]. 李明,胡吉霞,侯琳娜,严峻. 计算机应用. 2019(S2)
[2]中文文本分类方法综述[J]. 于游,付钰,吴晓平. 网络与信息安全学报. 2019(05)
[3]摄影领域评论情感词典构建方法[J]. 刘亚桥,陆向艳,邓凯凯,阮开栋,刘峻. 计算机工程与设计. 2019(10)
[4]面向突发事件应急管理的情感词典构建——以“暴雨洪涝”灾害为例[J]. 周莉,杨小俪. 武汉理工大学学报(社会科学版). 2019(04)
[5]基于多部情感词典与SVM的电影评论情感分析[J]. 吴杰胜,陆奎,王诗兵. 阜阳师范学院学报(自然科学版). 2019(02)
[6]基于改进随机森林算法的文本分类研究与应用[J]. 刘勇,兴艳云. 计算机系统应用. 2019(05)
[7]文本情感分析方法研究综述[J]. 洪巍,李敏. 计算机工程与科学. 2019(04)
[8]结合word2vec与扩充情感词典的微博多元情感分类研究[J]. 王名扬,吴欢,贾晓婷. 东北师大学报(自然科学版). 2019(01)
[9]基于深度学习的女装图片分类探索[J]. 叶锦,彭小江,乔宇,邢昊. 集成技术. 2019(02)
[10]基于中文社交媒体文本的领域情感词典构建方法研究[J]. 蒋翠清,郭轶博,刘尧. 数据分析与知识发现. 2019(02)
硕士论文
[1]基于机器学习的中文文本分类算法的研究与实现[D]. 朱梦.北京邮电大学 2019
[2]产品评论文本的情感分析方法研究[D]. 原多多.兰州财经大学 2019
[3]商品评论情感分析技术研究[D]. 张佳悦.北京交通大学 2018
[4]基于情感分析的汽车推荐系统的设计与实现[D]. 王彦婕.山西大学 2018
[5]基于酒店中文评论情感倾向分析[D]. 李长江.华南理工大学 2016
本文编号:3112977
【文章来源】:河北工程大学河北省
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
京东源码截图
第3章基于Scrapy框架的数据采集23图3-7京东源码截图Fig.3-7JDsourcecodescreenshot通过同样的分析方法,可以发现淘宝用于存储商品评论的文件为包含有list_detail的文件,商品评论的URL同样可以在headers中找到,如图3-8所示。图3-8淘宝源码截图Fig.3-8screenshotofTaobaosourcecode在对其他笔记本电脑进行同样的分析后,可以发现这些用于存储商品评论的URL的区别仅在于商品的ID不同,所以本文依此构造了商品评论的初始URL,并通过更改URL中的商品ID来构造出相应商品评论的URL。获取评论的URL后,就可分析电商平台返回的数据来制定相应的爬虫规则来获取评论内容、评分等信息。本文以京东商城的返回数据为例进行分析,如图3-9所示,可以发现返回的响应数据是json格式的数据,所以可以通过查找数据中的key来获取对应的数据,其中存放评论的key是content,存放评论创建时间的是creationTime,存放用户评分的是score。因此通过遍历数据中的content、createTime、score来获取到相应的数据。图3-9京东响应数据截图Fig.3-9JDresponsedatascreenshot
第3章基于Scrapy框架的数据采集23图3-7京东源码截图Fig.3-7JDsourcecodescreenshot通过同样的分析方法,可以发现淘宝用于存储商品评论的文件为包含有list_detail的文件,商品评论的URL同样可以在headers中找到,如图3-8所示。图3-8淘宝源码截图Fig.3-8screenshotofTaobaosourcecode在对其他笔记本电脑进行同样的分析后,可以发现这些用于存储商品评论的URL的区别仅在于商品的ID不同,所以本文依此构造了商品评论的初始URL,并通过更改URL中的商品ID来构造出相应商品评论的URL。获取评论的URL后,就可分析电商平台返回的数据来制定相应的爬虫规则来获取评论内容、评分等信息。本文以京东商城的返回数据为例进行分析,如图3-9所示,可以发现返回的响应数据是json格式的数据,所以可以通过查找数据中的key来获取对应的数据,其中存放评论的key是content,存放评论创建时间的是creationTime,存放用户评分的是score。因此通过遍历数据中的content、createTime、score来获取到相应的数据。图3-9京东响应数据截图Fig.3-9JDresponsedatascreenshot
【参考文献】:
期刊论文
[1]商品评论情感倾向性分析[J]. 李明,胡吉霞,侯琳娜,严峻. 计算机应用. 2019(S2)
[2]中文文本分类方法综述[J]. 于游,付钰,吴晓平. 网络与信息安全学报. 2019(05)
[3]摄影领域评论情感词典构建方法[J]. 刘亚桥,陆向艳,邓凯凯,阮开栋,刘峻. 计算机工程与设计. 2019(10)
[4]面向突发事件应急管理的情感词典构建——以“暴雨洪涝”灾害为例[J]. 周莉,杨小俪. 武汉理工大学学报(社会科学版). 2019(04)
[5]基于多部情感词典与SVM的电影评论情感分析[J]. 吴杰胜,陆奎,王诗兵. 阜阳师范学院学报(自然科学版). 2019(02)
[6]基于改进随机森林算法的文本分类研究与应用[J]. 刘勇,兴艳云. 计算机系统应用. 2019(05)
[7]文本情感分析方法研究综述[J]. 洪巍,李敏. 计算机工程与科学. 2019(04)
[8]结合word2vec与扩充情感词典的微博多元情感分类研究[J]. 王名扬,吴欢,贾晓婷. 东北师大学报(自然科学版). 2019(01)
[9]基于深度学习的女装图片分类探索[J]. 叶锦,彭小江,乔宇,邢昊. 集成技术. 2019(02)
[10]基于中文社交媒体文本的领域情感词典构建方法研究[J]. 蒋翠清,郭轶博,刘尧. 数据分析与知识发现. 2019(02)
硕士论文
[1]基于机器学习的中文文本分类算法的研究与实现[D]. 朱梦.北京邮电大学 2019
[2]产品评论文本的情感分析方法研究[D]. 原多多.兰州财经大学 2019
[3]商品评论情感分析技术研究[D]. 张佳悦.北京交通大学 2018
[4]基于情感分析的汽车推荐系统的设计与实现[D]. 王彦婕.山西大学 2018
[5]基于酒店中文评论情感倾向分析[D]. 李长江.华南理工大学 2016
本文编号:3112977
本文链接:https://www.wllwen.com/guanlilunwen/pinpaiwenhualunwen/3112977.html