基于在线评论的企业产品缺陷识别
发布时间:2018-03-21 21:36
本文选题:在线评论 切入点:缺陷识别 出处:《哈尔滨工业大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着大数据时代来临,各种社交网络如微信朋友圈、微博、知乎、贴吧等、电子商务购物网站如京东、天猫、网易优选等平台的兴起,通过网络平台表达用户的观点和情感,分享个人经历等已经越来越普遍。近几年来,电子商务领域也为家电行业带来了生机,家电产品的质量问题也慢慢显露。如果能尽早地发现产品缺陷,就可以最大程度减少企业产品缺陷对用户和企业品牌带来的伤害。用户在购买商品后通常会在网上留下评价,可以从这些海量的无结构化文本中发现产品缺陷。由于现有的中文环境下产品缺陷识别模型中有监督学习方法人工标注效率低,以及半监督学习基于分歧的Tri-training分类算法性能不够好,改善产品识别分类算法的效果对中文环境下网络评论下进行企业产品质量管理有着一定的借鉴意义。为了从互联网环境下的用户评论中分析出企业产品缺陷内容,本文通过分析前人所做出的模型和方法,构建本文的基于互联网环境下在线评论的产品缺陷识别模型框架,包含数据准备、文本分类和文本聚类。根据家电产品缺陷识别的特点,选择基于分歧的半监督分类Co-forest算法建立评论分类模型,对基于互联网环境下在线评论的家电行业产品评论识别缺陷,得到包含缺陷的产品评论。对文本分类后包含缺陷的评论再使用针对短文本评论的BTM主题聚类算法对缺陷评论进行主题聚类,得到缺陷主题、主题描述详情及占比。通过某品牌的一款畅销除湿机,对上述研究进行了相关实验。研究结果表明,本文提出使用Co-forest算法与现有的有监督分类产品缺陷识别方法和Tri-training分类算法相互比较,Co-forest算法具有较高的算法准确率和召回率。并且对Co-forest算法识别出的缺陷评论再基于主题模型BTM算法进行缺陷主题聚类,得到可被产品缺陷管理人员理解的缺陷主题结果。本文对国内家电行业产品缺陷进行分析,拓展了社会媒体挖掘研究范围,在一定程度上能协助企业在生产设计、质量管理等方向根据产品缺陷反馈及时处理。
[Abstract]:With the advent of big data, the rise of various social networks, such as the WeChat Moments, Weibo, Weibo, Tiefa, etc., and the rise of e-commerce shopping websites, such as #china_person鈪,
本文编号:1645637
本文链接:https://www.wllwen.com/jingjilunwen/xmjj/1645637.html