基于第二十一届成都国际汽车展览会的数据挖掘
发布时间:2020-04-25 07:56
【摘要】:第二十一届成都国际汽车展览会于2018年8月31日至9月9日举行。成都车展稳居中国四大A级车展之列。基于第二十一届成都国际汽车展览会这一大盛事,利用机器学习技术和计算机技术对数据进行深层挖掘显得尤为必要,也非常有意义。本文首先通过随机森林、多层前馈神经网络、支持向量机这三种机器学习方法构建汽车品牌及车系的自动识别模型,将太平洋汽车、新浪汽车、搜狐汽车、网上车市、一猫汽车、凤凰汽车、网易汽车、腾讯汽车这八个汽车网站的汽车品牌别名和车系别名自动统一对齐到标准品牌名称和标准车系名称,并以步进的方式更新训练集得到一个标准品牌名称和标准车系名称的数据库。此数据库包含brand_name、brand_id、car_name、car_id、standard_brand、standard_car、web这七项指标的17972条信息。然后采用LDA模型,从三个维度对8月28日至9月12日期间关于成都车展的新闻报道进行话题推断,得到车型测试、产品性能、品牌战略、消费者口碑营销、新车上市、产品规划这六个话题以及每天谈论每个话题的新闻篇数。本文有以下几个创新点:第一,研究所使用的数据是最新的,尤其是进行话题推断所使用的新闻数据是每天更新的,具有时效性。第二,得到了一个标准品牌名称和标准车系名称的数据库,这为计算用户的汽车品牌偏好以及车系偏好提供支撑,也为日后对其他车展进行研究提供了方便。第三,从品牌这个维度进行话题推断的结果发现某些品牌在展前、展中、展后这三个阶段对六个话题的关注度有转移趋势,在一定程度上为这些品牌提供了商机。
【图文】:
图3.1逦9月12日宝马的第一篇新闻逡逑这篇新闻报道的话题推断结果是产品规划。我们看完这篇新闻之后总结提主要内容为:中国联通和宝马集团进行合作,利用前沿先进技术使宝马旗下的在各个方面得到提升,,给宝马用户提供更智能的服务。可以发现由话题模型,。逡逑
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
本文编号:2639993
【图文】:
图3.1逦9月12日宝马的第一篇新闻逡逑这篇新闻报道的话题推断结果是产品规划。我们看完这篇新闻之后总结提主要内容为:中国联通和宝马集团进行合作,利用前沿先进技术使宝马旗下的在各个方面得到提升,,给宝马用户提供更智能的服务。可以发现由话题模型,。逡逑
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
【参考文献】
相关期刊论文 前10条
1 陈文涛;张小明;李舟军;;构建微博用户兴趣模型的主题模型的分析[J];计算机科学;2013年04期
2 王晓斌;温春;石昭祥;;基于贝叶斯信息准则的文本主题数估计[J];计算机工程;2009年07期
3 王定成,方廷健,高理富,马永军;支持向量机回归在线建模及应用[J];控制与决策;2003年01期
4 马勇,丁晓青;基于层次型支持向量机的人脸检测[J];清华大学学报(自然科学版);2003年01期
5 叶航军,白雪生,徐光yP;基于支持向量机的人脸姿态判定[J];清华大学学报(自然科学版);2003年01期
6 朱国强,刘士荣,俞金寿;基于支持向量机的数据建模在软测量建模中的应用[J];华东理工大学学报;2002年S1期
7 张周锁,李凌均,何正嘉;基于支持向量机的机械故障诊断方法研究[J];西安交通大学学报;2002年12期
8 时文刚,刘树林,张嘉钟,黄文虎;基于支持向量机的往复泵泵阀故障诊断方法[J];机械强度;2002年03期
9 张磊,林福宗,张钹;基于支持向量机的相关反馈图像检索算法[J];清华大学学报(自然科学版);2002年01期
10 肖健华,樊可清,吴今培,杨叔子;应用于故障诊断的SVM理论研究[J];振动、测试与诊断;2001年04期
相关博士学位论文 前1条
1 项延德;基于卷积神经网络的心电信号检测和分类研究[D];浙江大学;2018年
本文编号:2639993
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2639993.html