在线评论中的产品属性提取及有用性识别研究
本文选题:在线评论 + 属性提取 ; 参考:《大连理工大学》2016年硕士论文
【摘要】:随着近些年,互联网向着网站与用户之间双向互动的Web2.0时代高速发展,在线评论这种非结构化文本数据迎来了爆发性的增长。这些数据中包含了大量的有用信息,是影响用户决策的重要影响因素之一,也是厂商家制定产品的研发和改进策略的主要依据。然而,由于在线评论数据量巨大,并且消费者往往具有不同的关注点与喜好,如何筛选出质量较高的在线评,并从在线评论中提取关于产品各方面属性的相关评价信息,就显得格外重要。为了可以从在线评论中找到用户关注的产品信息,本文提出了一种基于互自扩展模式的产品属性提取算法。算法的核心思想是通过计算机自我学习,增量迭代达到理想效果。同时结合FP-Growth算法对该模式进行改进,使其不但可以无需人工标注种子库,从而避免算法结果的不确定性,而且可以提高自扩展模式中增量迭代的速度,获得更好的扩展效果。为了降低自扩展模式下主题偏移的情况发生,又给出了一种提取词、提取模式置信度的求解方法。为了克服中文分词、词性标注中出现错误,提出了相似提取模式和复合提取词的概念并给出了其挖掘方法,该方法能够在牺牲较少准确率的情况下,较好的提高召回率。最后实验显示算法对中文在线评论中产品属性的提取效果,平均准确率为78.50%,平均召回率为79.81%,平均F-score为78.97%,取得了较好的提取效果。对英文评论中的产品属性提取效果,准确率为80.22%,召回率为72.28%,F-score为76.04%,相比较于文献中其它同类研究,在准确率上获得了较大的提升。基于上文所提到的产品属性提取算法而建立的产品属性数据库,考虑到通常用户在阅读在线评论时,都对评论内容所包含的属性存在一个心理预期,不同产品、甚至相同产品不同品牌之间,这些预期都是不同的。如果评论可以满足用户预期,将会对用户认为评论是否有用产生重要影响。基于以上考虑,通过将在线评论有用性判别问题转化为文本分类问题,采用SVM支持向量机方法,利用开元的LibSVM软件实现文本分类器,结合其他学者的研究成果,提出九种特征值,实现了对评论有用性的机器识别。实验表明,对评论有用性的识别准确率平均在90.67%,验证了算法的有效性,同时也证明了用户心理预期的产品属性描述对用户评判在线评论有用性存在着较大的影响。本文研究成果可以为用户在线购物提供决策支持,为厂商家改善产品及服务提供理论依据,还能够促进电子商务平台完善在线评论系统,极具理论与实践意义。
[Abstract]:In recent years, with the rapid development of the Internet towards the Web2.0 era of two-way interaction between Web sites and users, online reviews of unstructured text data are experiencing an explosive growth.These data contain a large amount of useful information, which is one of the important factors that affect the decision of users, and is also the main basis for manufacturers to formulate product development and improvement strategies.However, because of the huge amount of online comment data, and consumers often have different concerns and preferences, how to screen out high quality online reviews and extract relevant evaluation information about product attributes from online reviews.It's all the more important.In order to find the product information of users' concern from online comments, this paper proposes a product attribute extraction algorithm based on mutual self-expansion mode.The core idea of the algorithm is to achieve ideal results through computer self-learning and incremental iteration.At the same time, the scheme is improved with FP-Growth algorithm, which can not only avoid the uncertainty of the algorithm result, but also improve the speed of incremental iteration in the self-expanding mode and obtain better expansion effect.In order to reduce the occurrence of topic offset in the self-expanding mode, a method of extracting the word and extracting the confidence degree of the pattern is presented.In order to overcome the errors in Chinese word segmentation and part of speech tagging, the concepts of similar extraction pattern and compound word extraction are proposed and their mining methods are given. This method can improve the recall rate at the expense of less accuracy.Finally, the experimental results show that the average accuracy is 78.50, the average recall rate is 79.81, and the average F-score is 78.97.The accuracy of product attribute extraction is 80.222.The recall rate is 72.28 and the F-score is 76.044.Compared with other similar studies in the literature, the accuracy rate has been greatly improved.The product attribute database based on the product attribute extraction algorithm mentioned above, considering that users usually have a psychological expectation about the attributes contained in the comments when reading online comments, different products,Even the same product and different brands, these expectations are different.If the comment meets the user's expectations, it will have a significant impact on whether the comment is useful or not.Based on the above considerations, the text categorizer is realized by using SVM support vector machine (SVM) and open LibSVM software, by transforming the problem of online comment usefulness discrimination into text categorization, and combining with the research results of other scholars.Nine eigenvalues are proposed to realize the machine recognition of comment usefulness.Experiments show that the average recognition accuracy of comment usefulness is 90.67, which verifies the validity of the algorithm, and also proves that the product attribute description expected by users' psychology has a great influence on the usefulness of online reviews.The research results of this paper can provide decision support for online shopping, provide theoretical basis for factories and merchants to improve their products and services, and promote e-commerce platform to perfect online comment system, which is of great theoretical and practical significance.
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F724.6
【相似文献】
相关期刊论文 前10条
1 孙洪杰;周庭锐;;整合框架下的产品属性比较机理研究综述[J];管理学报;2011年10期
2 李博;董晓凯;莫苏宁;;产品属性挖掘综述[J];现代商贸工业;2012年09期
3 张子平;;从产品到商品[J];肉类研究;2009年05期
4 孙晓东;冯学钢;;多顾客个性化需求下产品属性配置策略[J];工业工程;2013年01期
5 方明;市场经济条件下高速公路建设发展的公共性产品属性探讨[J];生产力研究;2004年12期
6 于春玲;赵平;;谈品牌的情感定位[J];市场营销导刊;2004年03期
7 张金萍,周游;网络营销中产品属性与渠道属性匹配研究[J];商业研究;2003年17期
8 孙荣;;教育产品的属性分析[J];企业导报;2012年07期
9 孙丽辉;以最大满意度为目标进行产品属性组合的优化决策[J];工业技术经济;1996年06期
10 王宏起,胡运权;高新技术产品属性综合认定方法及应用的研究[J];管理世界;2002年03期
相关会议论文 前4条
1 孟昭祥;;高速公路产品属性及收费标准的探讨[A];中国高速公路管理学术论文集(2010卷)[C];2010年
2 张姝;贾文杰;夏迎炬;孟遥;于浩;;产品属性归类技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 余传明;陈雷;张小青;;基于支持向量机的产品属性识别研究[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年
4 陈萦;;高等教育的产品属性及其对供给模式的影响[A];2007年中国教育经济学年会会议论文集[C];2007年
相关重要报纸文章 前6条
1 张立伟;品牌建设从产品识别开始[N];江苏经济报;2007年
2 徐曼;怎样为品牌取个好名字[N];中国质量报;2004年
3 本报记者 刘旭;企业有条不紊应对欧盟新规[N];国际商报;2014年
4 沈菏生;品牌规划的四个“筹码”[N];医药经济报;2006年
5 品文;品牌的陷阱[N];厂长经理日报;2001年
6 袁孝冲;走出品牌建设的误区[N];中国冶金报;2008年
相关博士学位论文 前3条
1 余樱;享乐适应视角下顾客持续满意度的影响因素及内在机制研究[D];华中科技大学;2015年
2 辜红;奢侈品产品属性对持续满意影响的实证研究[D];华中科技大学;2012年
3 雷超;市场属性与产品属性对跨境购物意愿的影响[D];暨南大学;2011年
相关硕士学位论文 前10条
1 扈夏蒙;概念设计阶段用户需求到产品属性的转化方法研究[D];北京服装学院;2016年
2 于明朕;在线评论中的产品属性提取及有用性识别研究[D];大连理工大学;2016年
3 李法生;产品属性对农村消费者购后行为影响的实证研究[D];辽宁工程技术大学;2012年
4 冯小翼;在线评论的产品属性提取与情感分析研究[D];华中科技大学;2011年
5 高会娟;产品属性挖掘及应用[D];北方工业大学;2015年
6 赵丽影;产品开发中顾客需求转化为产品属性的路径研究[D];东北师范大学;2005年
7 郑璐;产品属性分析方法及其应用[D];西南交通大学;2005年
8 杨春梅;基于联合分析法的消费者产品属性偏好的确定[D];东北大学;2008年
9 夏亚丽;生活形态、产品属性之相关性研究[D];南京理工大学;2006年
10 娄慧娜;基于手段—目的链的顾客满意因素分析[D];厦门大学;2007年
,本文编号:1765261
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1765261.html