商品评价查询系统的设计与实现
发布时间:2021-12-30 16:23
本论文设计了一种基于短文本情感分类模型的分类方法,并在此基础上开发了一套商品评价查询系统。本论文的主要工作有两点:一是研究了短文本的词汇特性,再结合情感词典和了SO-PMI算法设计了一种情感模型,并通过对比实验证明,使用该情感模型在对商品评价进行分类时表现良好。二是严格按照软件开发的流程,在情感模型的基础上设计和开发了商品评价查询系统。商品评价查询系统能够帮助人们更快捷方便地了解一件商品,该系统分为三个大模块:一是爬虫模块,针对京东、淘宝、太平洋等网站编写了专门的爬虫程序,每天定时从这些网站上获取评价信息。二是评价分类程序,通过情感模型将评价分为好评或者差评。三是评价查询系统,为用户提供商品评价查询和对比服务。系统工作流程如下:首先通过爬虫程序从京东、淘宝、太平洋等热门网站获取商品评价信息,然后通过自己情感模型对评价进行分类(好评和差评),最后用户通过评价查询系统可以获取某件商品的正面评价和负面评价,还能进行评价对比。开发时,使用Java作为编程语言,Mysql作为数据库,使用了SSH2框架、Lucene、Ajax等技术完成商品评价查询系统的编写。经过测试,最终实现的商品评价查询系统能...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:96 页
【学位级别】:硕士
【部分图文】:
MVC架构
第六章系统实现35格式存储的,包含了评价内容和所属网站ID两部分信息。这样设计是为了查询网站获得结果后方便解析和显示,提高系统效率。图6-2数据库中的评价信息格式为了在进行商品名检索时能准确且快速的获得检索结果,不能使用数据库的like‘%...%’查询,因此选择通过Lucene来进行辅助搜索。Lucene自带有很多建立索引和进行多条件查询的方法,通过Lucene对商品信息建立索引,进行关键词检索时是在索引文件中进行搜索,检索效率和准确率将大大提升。网上采集到的原始评价都先存入原始评价表(comment)中。原始评价经过评价分类程序分类后,被归类为好评或者差评,好评存入好评表(good)中,差评存入差评表(bad)中,中性评价则被舍弃。分类程序基于的情感模型是如何的设计的将在5.3节中详细描述。截止到目前,爬虫程序总共采集到了34万条商品信息,其中有大约24万条都是来源于京东商城,剩下的大约10万条来源于太平洋电脑城和易迅网。原始的商品评价有大约有二千二百多万条,对所有评价进行情感模型分类后,得到了约一千四百万条好评和三百五十万条差评。如图6-3所示。图6-3系统的数据规模6.4系统索引的建立和查询从上一节所描述的数据规模可以知晓,商品评价查询系统的数据存储量很庞大。如果在进行模糊查询时,使用SQL语句进行查找,运行速度十分低下,并且得到的结果也很差,这将对用户体验带来毁灭性的打击。因此,引入了Lucene建立索引机制来解决该问题。索引内容包括商品的id、title、keywords、title和url。相关程序的部分代码如下所示:1.建立索引
电子科技大学硕士学位论文36图6-5建立索引的关键代码从图6-5的代码中可以看出,程序建立的索引除了包含了商品的id、title、keywords等信息外,还包含了权重,这样检索得到的结果更加准确科学。2.根据关键词检索索引文件:
【参考文献】:
期刊论文
[1]基于SVM的用户评论情感分析方法研究[J]. 常丹,王玉珍. 枣庄学院学报. 2019(02)
[2]基于共现分析的文本主题词聚类研究[J]. 阮光册,夏磊. 图书馆杂志. 2018(11)
[3]一种面向旅游评论的情感特征识别方法[J]. 陈耀东,彭蝶飞. 计算机技术与发展. 2018(11)
[4]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[5]基于CNN和SOM的评论主题发现[J]. 谢宗彦,黎巎,周纯洁. 情报科学. 2018(06)
[6]基于情感知识和机器学习算法的组合微文情感倾向分类研究[J]. 何跃,赵书朋,何黎. 情报杂志. 2018(05)
[7]基于Web的科研项目管理系统的设计和实现[J]. 陈多泽. 电脑迷. 2018(02)
[8]基于同义词词林的社会化标签等级结构构建研究[J]. 熊回香,叶佳鑫. 情报杂志. 2018(01)
[9]基于情感特征的主客观分类研究[J]. 马力,丁蔚,李培,王芸. 西安邮电大学学报. 2017(04)
[10]基于多维扩展特征与深度学习的微博短文本情感分析[J]. 孙晓,彭晓琪,胡敏,任福继. 电子与信息学报. 2017(09)
硕士论文
[1]Web商品舆情信息集成系统的设计与实现[D]. 王路.电子科技大学 2014
[2]马尔可夫链预测模型及一些应用[D]. 温海彬.南京邮电大学 2012
本文编号:3558569
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:96 页
【学位级别】:硕士
【部分图文】:
MVC架构
第六章系统实现35格式存储的,包含了评价内容和所属网站ID两部分信息。这样设计是为了查询网站获得结果后方便解析和显示,提高系统效率。图6-2数据库中的评价信息格式为了在进行商品名检索时能准确且快速的获得检索结果,不能使用数据库的like‘%...%’查询,因此选择通过Lucene来进行辅助搜索。Lucene自带有很多建立索引和进行多条件查询的方法,通过Lucene对商品信息建立索引,进行关键词检索时是在索引文件中进行搜索,检索效率和准确率将大大提升。网上采集到的原始评价都先存入原始评价表(comment)中。原始评价经过评价分类程序分类后,被归类为好评或者差评,好评存入好评表(good)中,差评存入差评表(bad)中,中性评价则被舍弃。分类程序基于的情感模型是如何的设计的将在5.3节中详细描述。截止到目前,爬虫程序总共采集到了34万条商品信息,其中有大约24万条都是来源于京东商城,剩下的大约10万条来源于太平洋电脑城和易迅网。原始的商品评价有大约有二千二百多万条,对所有评价进行情感模型分类后,得到了约一千四百万条好评和三百五十万条差评。如图6-3所示。图6-3系统的数据规模6.4系统索引的建立和查询从上一节所描述的数据规模可以知晓,商品评价查询系统的数据存储量很庞大。如果在进行模糊查询时,使用SQL语句进行查找,运行速度十分低下,并且得到的结果也很差,这将对用户体验带来毁灭性的打击。因此,引入了Lucene建立索引机制来解决该问题。索引内容包括商品的id、title、keywords、title和url。相关程序的部分代码如下所示:1.建立索引
电子科技大学硕士学位论文36图6-5建立索引的关键代码从图6-5的代码中可以看出,程序建立的索引除了包含了商品的id、title、keywords等信息外,还包含了权重,这样检索得到的结果更加准确科学。2.根据关键词检索索引文件:
【参考文献】:
期刊论文
[1]基于SVM的用户评论情感分析方法研究[J]. 常丹,王玉珍. 枣庄学院学报. 2019(02)
[2]基于共现分析的文本主题词聚类研究[J]. 阮光册,夏磊. 图书馆杂志. 2018(11)
[3]一种面向旅游评论的情感特征识别方法[J]. 陈耀东,彭蝶飞. 计算机技术与发展. 2018(11)
[4]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[5]基于CNN和SOM的评论主题发现[J]. 谢宗彦,黎巎,周纯洁. 情报科学. 2018(06)
[6]基于情感知识和机器学习算法的组合微文情感倾向分类研究[J]. 何跃,赵书朋,何黎. 情报杂志. 2018(05)
[7]基于Web的科研项目管理系统的设计和实现[J]. 陈多泽. 电脑迷. 2018(02)
[8]基于同义词词林的社会化标签等级结构构建研究[J]. 熊回香,叶佳鑫. 情报杂志. 2018(01)
[9]基于情感特征的主客观分类研究[J]. 马力,丁蔚,李培,王芸. 西安邮电大学学报. 2017(04)
[10]基于多维扩展特征与深度学习的微博短文本情感分析[J]. 孙晓,彭晓琪,胡敏,任福继. 电子与信息学报. 2017(09)
硕士论文
[1]Web商品舆情信息集成系统的设计与实现[D]. 王路.电子科技大学 2014
[2]马尔可夫链预测模型及一些应用[D]. 温海彬.南京邮电大学 2012
本文编号:3558569
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3558569.html