当前位置:主页 > 科技论文 > 软件论文 >

基于用户评论的自动摘要的研究和分析

发布时间:2018-09-04 14:03
【摘要】:电子商务在迅猛发展,网络信息日益增多。随着越来越多的人在网上购物,如何提高用户体验加强商家与用户、用户与用户之间的信息交流成了一个重要的问题。用户购物后留下的评论是用户之间和用户与商家之间信息反馈的重要平台,因此本文提出了对用户评论进行研究。对用户评论的挖掘和传统的文本挖掘有所不同,因为用户评论一般远远短于普通文本长度,聚焦的信息点更细。这其中涉及了很多自然语言处理,机器学习和数据挖掘的技术。随着机器学习的发展,特别是深度学习的兴起,很多问题都得到了进一步的深层次研究。本文结合自然语言处理基础知识,关联挖掘算法,层次聚类模型,神经网络和决策树算法等对评论自动摘要做了新的研究。本文针对中文的特性,对提取英文中评论特征的Apriori算法做了改进,取得了不错的效果,证明了该方式的可行性。提出了使用词激活力模型对评论特征聚类,比传统聚类模型有更强的适用性。针对评论句的情感分析,基于word2vec使用了递归自编码的神经网络,比传统朴素贝叶斯分类器,F1值提升了大约8%。最后提出使用决策树建立特征的层次模型,更好的组织了摘要的展示。
[Abstract]:E-commerce is developing rapidly, network information is increasing day by day. With more and more people shopping on the Internet, how to improve the user experience and enhance the exchange of information between merchants and users has become an important issue. The comments left by users after shopping is an important platform for information feedback between users and merchants, so this paper proposes a research on user comments. The mining of user comments is different from that of traditional text mining because user comments are usually much shorter than ordinary text and focus on more detailed information points. This involves many natural language processing, machine learning and data mining techniques. With the development of machine learning, especially the rise of deep learning, many problems have been further studied. Based on the basic knowledge of natural language processing, association mining algorithm, hierarchical clustering model, neural network and decision tree algorithm, this paper makes a new research on automatic summary of comments. According to the characteristics of Chinese, this paper improves the Apriori algorithm for extracting comment features in English, and obtains good results, which proves the feasibility of this method. In this paper, the word activation force model is applied to comment feature clustering, which is more applicable than the traditional clustering model. For the emotional analysis of comment sentences, the recurrent self-coding neural network is used based on word2vec, which is about 8 times higher than the traditional naive Bayesian classifier. Finally, a hierarchical model based on decision tree is proposed to better organize the presentation of the summary.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1

【参考文献】

相关期刊论文 前9条

1 梁军;柴玉梅;原慧斌;昝红英;刘铭;;基于深度学习的微博情感分析[J];中文信息学报;2014年05期

2 莫倩;杨珂;;网络水军识别研究[J];软件学报;2014年07期

3 郭福亮;周钢;;基于HMM的个体微博情感分析预测方法研究[J];舰船电子工程;2014年02期

4 孟凡新;;中国网络购物市场研究报告[J];互联网天地;2013年06期

5 李实;叶强;李一军;Rob Law;;中文网络客户评论的产品特征挖掘方法研究[J];管理科学学报;2009年02期

6 伍星;何中市;黄永文;;产品评论挖掘研究综述[J];计算机工程与应用;2008年36期

7 章剑锋;张奇;吴立德;黄萱菁;;中文观点挖掘中的主观性关系抽取[J];中文信息学报;2008年02期

8 董静;孙乐;冯元勇;黄瑞红;;中文实体关系抽取中的特征选择研究[J];中文信息学报;2007年04期

9 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期

相关会议论文 前1条

1 姚天f ;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;;一个用于汉语汽车评论的意见挖掘系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

相关博士学位论文 前1条

1 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年

相关硕士学位论文 前1条

1 吴桐;商品评论的摘要提取研究[D];北京邮电大学;2015年



本文编号:2222329

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2222329.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b749d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com