基于属性聚类的手机评价模型研究与应用
发布时间:2021-03-14 15:24
随着电商行业的快速发展,网络购物越来越受消费者的青睐。在购买手机时,消费者可以根据电商平台上的评论信息,分析手机在“外观”、“价格”、“功能”等方面的表现并做出判断。另外,手机生产商也可以通过分析评论来了解消费者的关注倾向,进而为新款手机的制造提供策略性帮助。本文提出的手机评价模型是以评论语料为依据,通过分析语料来反映消费者对手机某一特征的倾向程度,并为消费者或生产商提供参考。本文从手机的评价信息出发,研究现有评价模型、属性评价结构和属性聚类的相关理论,对相关技术方案深入思考。首先,设计爬虫规则并利用八爪鱼爬虫工具在京东商城上获取5种品牌的手机评论作为参考语料,把其中荣耀手机的评论用于检测模型的评估语料,即单款手机的评论语料;其次,根据现有的中文自然语言处理技术,对参考语料和单款手机的评论语料进行分词和去停用词处理;再次,用预处理过的参考语料训练CBOW(Continuous Bag-of-Words)模型得出参考语料模型,并由此模型得出与手机特征词相关的属性词及其词向量,进而通过Kmeans、谱聚类和SOM(Self-organizing Maps)对属性词的词向量进行聚类,并选取最...
【文章来源】:重庆邮电大学重庆市
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
不同特征词的参数测试结果
不同聚类算法的平均对比情况
不同阈值条件下的特征倾向度实验结果表明:不同阈值条件下,买家对手机某一特征的倾向程度不同,反
【参考文献】:
期刊论文
[1]融合语义信息的矩阵分解词向量学习模型[J]. 陈培,景丽萍. 智能系统学报. 2017(05)
[2]基于词向量和EMD距离的短文本聚类[J]. 黄栋,徐博,许侃,林鸿飞,杨志豪. 山东大学学报(理学版). 2017(07)
[3]基于CBC-LIKE算法的产品特征词聚类的研究[J]. 江伟,路松峰,杨莉萍. 现代电子技术. 2017(14)
[4]大数据环境下基于python的网络爬虫技术[J]. 谢克武. 电子制作. 2017(09)
[5]中文自然语言处理与计算机的结合问题研究[J]. 钟磊. 数字技术与应用. 2017(02)
[6]基于在线评论的产品选择方法[J]. 梁霞,姜艳萍,高梦. 东北大学学报(自然科学版). 2017(01)
[7]一种基于信息熵的混合数据属性加权聚类算法[J]. 赵兴旺,梁吉业. 计算机研究与发展. 2016(05)
[8]结合全局特征的命名实体属性值抽取[J]. 刘倩,伍大勇,刘悦,程学旗,庞琳. 计算机研究与发展. 2016(04)
[9]一种基于加权LDA模型的文本聚类方法[J]. 李国,张春杰,张志远. 中国民航大学学报. 2016(02)
[10]基于词项共现关系图模型的中文观点句识别研究[J]. 王明文,付翠琴,徐凡,洪欢. 中文信息学报. 2015(06)
硕士论文
[1]商品评论中的属性词聚类和扩展研究[D]. 杨静.北京邮电大学 2015
[2]电商和微博评论中商品属性与倾向性识别技术的研究与实现[D]. 褚剑峰.东华大学 2014
[3]实体—属性—框架语义知识库构建研究[D]. 饶思维.东北大学 2012
本文编号:3082442
【文章来源】:重庆邮电大学重庆市
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
不同特征词的参数测试结果
不同聚类算法的平均对比情况
不同阈值条件下的特征倾向度实验结果表明:不同阈值条件下,买家对手机某一特征的倾向程度不同,反
【参考文献】:
期刊论文
[1]融合语义信息的矩阵分解词向量学习模型[J]. 陈培,景丽萍. 智能系统学报. 2017(05)
[2]基于词向量和EMD距离的短文本聚类[J]. 黄栋,徐博,许侃,林鸿飞,杨志豪. 山东大学学报(理学版). 2017(07)
[3]基于CBC-LIKE算法的产品特征词聚类的研究[J]. 江伟,路松峰,杨莉萍. 现代电子技术. 2017(14)
[4]大数据环境下基于python的网络爬虫技术[J]. 谢克武. 电子制作. 2017(09)
[5]中文自然语言处理与计算机的结合问题研究[J]. 钟磊. 数字技术与应用. 2017(02)
[6]基于在线评论的产品选择方法[J]. 梁霞,姜艳萍,高梦. 东北大学学报(自然科学版). 2017(01)
[7]一种基于信息熵的混合数据属性加权聚类算法[J]. 赵兴旺,梁吉业. 计算机研究与发展. 2016(05)
[8]结合全局特征的命名实体属性值抽取[J]. 刘倩,伍大勇,刘悦,程学旗,庞琳. 计算机研究与发展. 2016(04)
[9]一种基于加权LDA模型的文本聚类方法[J]. 李国,张春杰,张志远. 中国民航大学学报. 2016(02)
[10]基于词项共现关系图模型的中文观点句识别研究[J]. 王明文,付翠琴,徐凡,洪欢. 中文信息学报. 2015(06)
硕士论文
[1]商品评论中的属性词聚类和扩展研究[D]. 杨静.北京邮电大学 2015
[2]电商和微博评论中商品属性与倾向性识别技术的研究与实现[D]. 褚剑峰.东华大学 2014
[3]实体—属性—框架语义知识库构建研究[D]. 饶思维.东北大学 2012
本文编号:3082442
本文链接:https://www.wllwen.com/jingjilunwen/gongyejingjilunwen/3082442.html