基于数值型在线评价信息的商品排序研究
【图文】:
① 数据可信度首先,相比其他常用的生活产品,如手机、电脑、服饰等,汽车的价格较高,消费者针对汽车的在线评价信息可能会更为谨慎,评价结果相对来说比较真实;其次,消费者通常是在具备一定驾驶能力的情况下才选择买汽车,消费者群体差异性较小,,消费者对于汽车使用的体验感知较为准确。综上,汽车的评价数据可信度高② 数据便于获取针对汽车的在线评价数据可以在相关电商网站查看并采集,以全球访问量最大的汽车网站——汽车之家为例。汽车之家主页提供了地域/品牌/车系分类,包含热门车、豪华车、小型/其他、商用车、推荐车、二手车等关键词可供选择。每款车都提供了车系首页、参数配置、图片实拍、报价、口碑、车型详解、文章、视频、保养等。其中,车系首页提供了用户评分和在线评价。每条在线评价信息包含:用户名购买车型、购买地点、购车经销商、购买时间、空间、动力、操控、油耗、舒适性外观、内饰、性价比、购车目的等。综上,汽车的数据便于获取。图 4.1 和图 4.2 分别展示了汽车之家的主页和用户的在线评价信息样例。
图 4.2 用户在线评价信息样例由图 4.2 可知,针对汽车的在线评价信息包含了文本型评价信息(如、属性评价的具体化描述、用户名、车型信息、购买地点、购买目的等)和数值型评价信息(属性的评价值、购买价、目前行驶里程等)。(2)采集数据确定考虑到本文的研究对象是数值型在线评价信息,而汽车的数值型评价信息中的购买时间、购买价格、行驶距离等与本文研究目的联系不大,因此,本文选取的汽车的数值型在线评价信息目前只采集属性相关的评价信息,即空间、动力、操控、油耗、舒适性、外观、内饰、性价比等 8 个关于汽车评价的属性及其对应的评价数据。假如某消费者想选购一款汽车,其给出的汽车理想价格区间为 15~25 万元,其拟定的四款汽车分别为:长安马自达(1A )、广汽丰田凯美瑞(2A )、上汽通用雪佛兰(3A )、一汽大众速腾(4A )。现用八爪鱼采集器从汽车之家网站上抓取 4 款备选汽车( 、 、 和 )的 8 个汽车属性的数值型在线评价信息。抓取的结
【学位授予单位】:武汉科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F724.6;F274
【相似文献】
相关期刊论文 前10条
1 郭奕崇;张建敏;刘丙午;;关于非数值型因素的指标相关性分析[J];塑料;2010年06期
2 林永民;吕震宇;赵爽;朱卫东;;基于样本分布与熵的数值型属性离散化[J];计算机工程与应用;2008年01期
3 从余;;CD播放机中使用的DAC(4) 符号数值型DAC[J];实用影音技术;2010年02期
4 谢静;张健沛;杨静;张冰;;面向近邻泄露的数值型敏感属性隐私保护方法[J];通信学报;2015年04期
5 刘友军;汪林林;;决策树中数值型属性分裂的研究[J];计算机科学;2006年05期
6 王书河,何麟书;飞行器多学科设计优化概述[J];宇航学报;2004年06期
7 黄明;詹海潭;张伟;经小川;李宁;王潇茵;;军工高安全软件数值型运行时错误分析方法[J];空间控制技术与应用;2016年06期
8 申德荣;于戈;寇月;聂铁铮;;可能世界内数值型不确定数据匹配模型[J];计算机应用研究;2008年09期
9 麻长立;冯光学;;分类点法在数值型分类中的应用[J];数学学习与研究;2016年01期
10 王涛;温蜜;;面向数值型敏感属性的隐私保护方案[J];计算机系统应用;2019年07期
相关会议论文 前3条
1 曹露燕;蒋晓云;孟凡荣;;基于数值型和分类型混合属性数据集的聚类算法研究[A];2006“数学技术应用科学”[C];2006年
2 梁晓蕾;张世栋;;时态数据库中非数值型属性周期规律挖掘以及关联规则提取[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 赵伟刚;魏海军;;鹿场生产管理信息系统的设计与开发[A];2010中国鹿业进展[C];2010年
相关重要报纸文章 前1条
1 河北 曹震宇;用数值微调器输入日期[N];中国电脑教育报;2000年
相关博士学位论文 前2条
1 王斌;交通安全不确定测度理论研究[D];西南交通大学;2012年
2 谢静;基于匿名的隐私保护方法研究[D];哈尔滨工程大学;2015年
相关硕士学位论文 前10条
1 刘若澜;基于数值型在线评价信息的商品排序研究[D];武汉科技大学;2019年
2 张学斌;数值型多维关联规则挖掘研究[D];西南师范大学;2005年
3 赵龙;英文自动问答系统中数值型问句的理解研究[D];大连海事大学;2016年
4 冯浩;后件为数值型属性的关联规则发现策略研究[D];北京交通大学;2009年
5 邓景毅;事务间数值型关联规则的数据挖掘[D];暨南大学;2003年
6 薛力峰;石家庄邮电职业技术学院培训综合信息管理系统分析与设计[D];北京邮电大学;2009年
7 李爽;基于模糊聚类的模糊查询及查询松弛方法的研究[D];辽宁大学;2015年
8 李翠翠;基于遗传算法的非数值型软件测试数据自动生成方法研究[D];北京化工大学;2006年
9 申罡;针对混合数值型和分类型属性数据的划分式聚类算法研究[D];北京交通大学;2015年
10 郭济琳;大型林业企业网络化管理信息系统的设计与实现[D];浙江大学;2005年
本文编号:2590467
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2590467.html