当前位置:主页 > 科技论文 > 软件论文 >

面向中文在线评论意见的挖掘算法研究及应用

发布时间:2018-08-22 20:07
【摘要】:网络购物行业的发展日益成熟,越来越多的消费者在购物网站发布评论信息。产品评论反映了消费者对产品的态度和意见,很有实用价值。一方面,产品评论可以影响其他消费者的购买意向;另一方面,产品评论反馈了产品各方面信息,方便商家提高产品和服务质量。但是,想要短时间内从大量的产品评论文本数据中得到有意义的信息,是非常困难的。研究中文评论意见挖掘方法,对于提高文本信息提取效率有重要意义。本文主要研究内容如下:以在线中文评论为研究对象,首先采用人工的方式,将主观性评论文本从产品评论中分离出来。然后利用自然语言处理技术,对中文在线评论意见文本进行预处理。针对已有的意见挖据工作对中文产品评论信息挖掘的低查全率和低查准率问题,文中提出了一种改进的中文在线评论意见挖掘算法。该方法根据自然语言表达方式,将评论文本分为四类句式结构。然后基于副词抽取各类评论文本中的产品意见词和特征词。实验结果表明,该方法能够有效提高中文产品评论意见挖掘的查全率和查准率。基于《同义词词林扩展版》将抽取出的产品特征和意见词中的同义词合并,再根据支持度阈值剪枝,得到最终的特征词和意见词。实验表明,该方法提高了同义词合并的准确性。本文改进的中文产品评论意见挖掘方法,可充分利用自然语言表达特点,实现对中文产品评论特征和意见词自动抽取。
[Abstract]:With the development of online shopping industry, more and more consumers publish comments on shopping websites. Product reviews reflect consumer attitudes and opinions on products and are of practical value. On the one hand, product review can affect the purchase intention of other consumers; on the other hand, product review feedback the information of all aspects of the product, which is convenient for merchants to improve the quality of products and services. However, it is very difficult to get meaningful information from a large amount of product review text data in a short time. It is important to study the mining method of Chinese comments for improving the efficiency of text information extraction. The main contents of this paper are as follows: firstly, the subjective comment text is separated from the product review by artificial method. Then the text of Chinese online comments is preprocessed by natural language processing technology. In order to solve the problem of low recall and low precision of Chinese product comment information mining, an improved Chinese online comment mining algorithm is proposed in this paper. According to the natural language expression, the commentary text is divided into four types of sentence structure. Then, product comment words and feature words are extracted from all kinds of comments based on adverbs. The experimental results show that this method can effectively improve the recall and precision of Chinese product comment mining. Based on the extended version of synonym forest, the extracted product features are combined with the synonyms in the opinion words, then pruned according to the support threshold, the final feature words and opinion words are obtained. Experiments show that this method improves the accuracy of synonym merging. The improved mining method of comments on Chinese products can make full use of the characteristics of natural language expression and realize the automatic extraction of comment features and words of Chinese products.
【学位授予单位】:西安科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【参考文献】

相关期刊论文 前10条

1 刘红光;马双刚;刘桂锋;;基于降噪自动编码器的中文新闻文本分类方法研究[J];现代图书情报技术;2016年06期

2 欧阳柳波;尹胜台;;层叠推理机的设计与实现[J];计算机应用与软件;2014年10期

3 张乃静;鞠洪波;纪平;;基于本体的林业领域文档特征权重模型[J];计算机工程与应用;2013年18期

4 罗宁;徐俊刚;;Web数据挖掘在电子商务中的应用[J];电子技术;2012年04期

5 郑艳红;张东站;;基于同义词词林的文本特征选择方法[J];厦门大学学报(自然科学版);2012年02期

6 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期

7 吴思颖;吴扬扬;;基于中文WordNet的中英文词语相似度计算[J];郑州大学学报(理学版);2010年02期

8 李晓红;;中文文本分类中的特征词抽取方法[J];计算机工程与设计;2009年17期

9 姚天f ;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期

10 姚天f ;娄德成;;汉语语句主题语义倾向分析方法的研究[J];中文信息学报;2007年05期

相关会议论文 前1条

1 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年

相关硕士学位论文 前4条

1 张宇晨;基于图结构的多关键字查询技术研究[D];南京邮电大学;2016年

2 陈琪;基于意见挖掘的网络课程评价研究[D];山东师范大学;2013年

3 金希茜;基于语义相似度的中文文本相似度算法研究[D];浙江工业大学;2009年

4 陆浩;网络舆情监测研究与原型实现[D];北京邮电大学;2009年



本文编号:2198172

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2198172.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7f296***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com