当前位置:主页 > 科技论文 > 软件论文 >

中文在线评论的产品特征与观点识别:跨领域的比较研究

发布时间:2018-03-28 20:32

  本文选题:在线评论 切入点:中文语境 出处:《管理工程学报》2017年04期


【摘要】:产品特征及观点的识别是细粒度情感分析的重要任务。但是,现有识别算法对中文语境下不同评论领域的适应性尚无定论,算法的鲁棒性也不理想,难以实现跨领域的算法移植。为此,选取词频统计方法、规则匹配、关联规则挖掘、具有句法格式的关联规则、CRF和SVM等6种代表性的识别算法,结合中文在线评论的语言特点,对上述算法引入到中文评论的文本分析中,根据准确率、召回率和F值指标,分析比较统计方法和机器学习方法在产品特征及观点识别上的性能。选择数码相机评论、化妆品评论、书评、酒店评论、影评、手机评论和餐厅评论7类语料3646条评论,分别采用6种算法进行产品特征和观点的抽取。实验表明,不同领域下的特征抽取难度是存在差异的;不同算法适应于不同领域;评论的文本长度对识别准确率和召回率有显著影响;另外,总体上机器学习的算法性能显著高于统计学方法。
[Abstract]:Recognition of product features and viewpoints is an important task in fine-grained emotional analysis. However, there is no conclusion on the adaptability of existing recognition algorithms to different comment areas in Chinese context, nor is the robustness of the algorithms ideal. It is difficult to realize cross-domain algorithm transplantation. Therefore, six representative recognition algorithms, such as word frequency statistic method, rule matching, association rule mining, association rule recognition algorithm with syntactic format and SVM, are selected, and combined with the language characteristics of Chinese online comment. The algorithm is introduced into the text analysis of Chinese comments. According to the accuracy rate, recall rate and F value index, the performance of statistical method and machine learning method in product feature and viewpoint recognition is analyzed and compared. Cosmetic reviews, book reviews, hotel reviews, film reviews, mobile phone reviews and restaurant reviews of seven corpus 3646 comments, using 6 algorithms to extract product features and views. The difficulty of feature extraction in different fields is different; different algorithms are suitable for different fields; the length of text of comments has a significant impact on the recognition accuracy and recall rate; in addition, Overall, the performance of machine learning algorithms is significantly higher than that of statistical methods.
【作者单位】: 华侨大学工商管理学院;同济大学经济与管理学院;
【基金】:国家自然科学基金资助项目(70971099、71371144、71402121) 上海市哲学社会科学规划课题一般项目(2013BGL004)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 黄永文;何中市;伍星;;产品特征的层次关系获取[J];计算机工程与应用;2009年22期

2 韩雪婷;李炜;沈奇威;;用户评论中产品特征的抽取及聚类[J];计算机系统应用;2013年05期

3 程昔恩;章义来;;基于产品特征的协同推荐方法及其应用[J];微计算机信息;2009年18期

4 张鹏;朱征宇;李存青;曾丽芳;陈烨;徐凯;常红要;;意见挖掘中产品特征的层次提取方法[J];微处理机;2010年05期

5 李实;李秋实;;中文评论中产品特征挖掘的剪枝算法研究[J];计算机工程;2011年23期

6 幸绍凯;张根保;麦小锋;谭术洋;;基于产品特征信息的创新方法研究及其应用[J];机械制造与自动化;2006年03期

7 郗亚辉;张明;袁方;王煜;;产品评论挖掘研究综述[J];山东大学学报(理学版);2011年05期

8 李实;陆光;;修正中文评论挖掘中产品特征词序的实验研究[J];科学技术与工程;2012年21期

9 李汇滨;杨雄勇;;基于用户认知的产品特征关联设计研究[J];消费导刊;2008年06期

10 刘蒙之;贾瑞雪;;“中文在线”的数字出版品牌建构思考[J];出版广角;2013年Z1期

相关重要报纸文章 前3条

1 本报记者 尹琨 实习生 陈也;精品阅读“盘活”数字出版[N];中国新闻出版报;2013年

2 本报记者 乔欣;“电子书包”进入教育实践[N];中国文化报;2011年

3 刘超;中文在线向青海捐赠数字图书馆[N];中国知识产权报;2008年

相关硕士学位论文 前1条

1 张阳;基于产品评论的观点挖掘研究[D];西北大学;2014年



本文编号:1677926

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1677926.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户be3fd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com