当前位置:主页 > 管理论文 > 移动网络论文 >

基于汽车网络舆情的数据分析系统研究与应用

发布时间:2020-11-05 00:02
   随着互联网技术的快速发展,网站浏览与信息发布成为人们网络生活不可缺少的一部分。与此同时,各大网站与论坛中已经积累了海量的网络舆情数据,其中蕴含着一定的挖掘与分析的价值。企业也已经将网络舆情监控、数据分析等工作列入企业数字化战略的一部分。对于整车企业而言,网络舆情数据分析正在不断地凸显其应用价值。整车企业开拓新市场依赖于精准的市场定位,并通过新车型的发布满足市场需求。传统的数据分析依赖于统计年鉴、行业管理部门数据、属地市场调查等信息,这些数据大多存在准确度低、时效性差、样本量不足等缺点。其次,依靠传统的数据收集和统计难以满足大数据环境下的分析需求,缺乏自动化的数据分析工具和有效的数据方法成为阻碍业务发展的痛点。除此之外,数据没有积累,导致了数据复用性,分析方法拓展性的严重缺失。采集并积累汽车网络舆情数据,构建高效、可靠的数据分析系统,通过数据可视化支持整车企业的战略决策成为了解决这些问题的关键。本文首先对网络舆情数据分析的研究背景与现状进行论述,介绍了本文的研究内容。其次对网络舆情分析的方法论,即文本挖掘进行了介绍,同时介绍了相关的算法与技术。然后在基于目前的现状,提出了一套整体的解决方案。对舆情情感分析、市场洞察分析和新词发现的研究与实验进行了论述。针对舆情情感分析,首先介绍了网络舆情数据预处理的过程,包括数据清洗、文本转换和分句分词。其中着重介绍了文本分词的原理和执行方法。然后根据汽车行业的特点构建了专业词库。本文将词库匹配和基于Spark的机器学习算法进行结合,提出了一套舆情情感分析的整体流程。着重介绍了机器学习算法的训练与评价过程。对决策树、逻辑回归、朴素贝叶斯等多种文本分类算法进行训练和测试,根据Fmeasure评价结果选择运行效果较好的算法运用到系统构建中。在汽车市场洞察分析中,本文针对整车产品的竞争关系、购车比较以及购车决策路径三个分析场景提出了相应的分析方法。运用词库匹配的方式进行数据处理。依托数据仓库技术,设计提供了相关主题域的逻辑模型。最终提供了多种图表展现的数据可视化方案呈现数据分析结果。为解决专业词库维护难度大的痛点,运用了隐马尔科夫模型、信息熵和正则表达式三个算法结合的方式,进行了基于汽车网络舆情的新词发现研究与应用,实现了专业词库的补充与网络流行语的洞察。为词库管理人员中提供了维护便利,为专业词库的管理工作提供了完整的解决方案。本文对基于汽车网络舆情的数据分析系统的设计与实施进行了介绍,最终完成了系统的构建工作。该系统为业务用户提供及时、可靠的数据分析成果,帮助整车企业了解消费者的需求与喜好,洞悉产品的竞争格局,为整车企业未来的汽车产品规划和定位提供决策支持。该系统在企业数字化转型的过程中证明了其实用性。
【学位单位】:上海交通大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP391.1;TP393.092
【部分图文】:

决策树,示例,里程碑


图 2-2 决策树示例Fig.2-2 Decision Tree Example生于上世纪 60 年代,由 J Ross Quinla个里程碑[19]。ID3 算法的基本思想是随低,从而提高算法的性能和精度。ID3,然后选择增益率最大的属性进行分裂

逻辑函数,图像,形式,离散选择


基于汽车网络舆算法简单高效,在对待具有不同数据特点的对某种特点的数据集稳定性较强。尽管实际常情况下,该分类效果仍比较精准。离散选择法模型之一,属于多重变量分析的临床医学等领域中用于统计分析的常用方法 ),设条件概率P( = ) = 为根据归模型可表示为:P( = ) = g( )函数称为逻辑函数。图 2-3 为该函数的图象

建模法,分类间隔,标签,分类超平面


图 2-4 SVM 基本思想图示Fig.2-4 SVM Standard Method ImageSVM 的基本思想是对于两类待分样本,, 、 分别为过两样样本中离分类超平面, 与 之间的距离叫做分类间隔(Mar本正确分开,且使分类间隔最大的超平面,围最新,最终风险最小化[22]。SVM 常用于SVM 的运行效果不好。文本数据将以标签化的形式在数据仓库中存,则需要以通过范式建模法或维度建模法构。另外,完成标签化的数据结果也从测试集化算法运行结果。
【相似文献】

相关期刊论文 前10条

1 李连铁;郑雪芳;周姣;;秦皇岛网络舆情监测研究[J];环渤海经济瞭望;2017年08期

2 沈阳;吴荆棘;;基于复杂因子的网络舆情推演研究[J];情报学报;2013年12期

3 李璟;;网络舆情的发展和社会稳定的关系[J];新闻研究导刊;2016年07期

4 盖姝;刘子毅;;大学生受网络舆情影响的因果机制研究——以微博为例[J];现代商贸工业;2020年03期

5 王文妤;阴雪颖;;基于模糊评价法政府实时监控网络舆情热度模型构建[J];中国管理信息化;2019年23期

6 任凯;郭黎黎;张燕;;社交网络舆情事件的生命周期模型研究[J];科技传播;2019年23期

7 罗阳倩子;;大数据时代高校网络舆情应对策略的重新定位研讨[J];科学咨询(教育科研);2019年12期

8 王萍;;大数据视域下我国环境网络舆情危机的应对策略[J];山东行政学院学报;2019年05期

9 陈昱杉;李凤全;王天阳;朱丽东;叶玮;;网络舆情信息扩散中距离的影响——以新浪微博“九寨沟地震”事件为例[J];浙江师范大学学报(自然科学版);2020年01期

10 朱小宇;;突发事件不同网络舆情峰值型原因探究[J];新闻研究导刊;2019年23期


相关博士学位论文 前10条

1 李诗悦;网络舆情事件治理中的伦理问题研究[D];湖南师范大学;2018年

2 张高唯;基于链路相似的虚拟空间与对应交易空间融合度研究分析[D];上海大学;2018年

3 何健;高校大学生网络舆情特征与管理对策研究[D];西南大学;2015年

4 王根生;面向群体极化的网络舆情演化研究[D];江西财经大学;2011年

5 张玉强;网络舆情危机的政府适度反应研究[D];中央民族大学;2011年

6 高俊峰;网络舆情场形成机理及信息受众观点测度研究[D];吉林大学;2017年

7 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年

8 王蕾;网络舆情信息与现实交易行为的映射关系研究与应用[D];上海大学;2016年

9 于淼;社交网络舆情传播与控制研究[D];哈尔滨工程大学;2016年

10 刘泉;基于个体社会属性的网络舆情演化模型研究[D];大连理工大学;2016年


相关硕士学位论文 前10条

1 王柳欣;河南省A县网络舆情应对研究[D];广西民族大学;2019年

2 黄旭;网络舆情监控管理系统设计与实现[D];上海交通大学;2016年

3 吴欢;群体性突发事件互联网舆情传播干预机制的研究[D];东北林业大学;2019年

4 陈林;警媒冲突的破解路径研究[D];华南理工大学;2019年

5 郑钊荣;新媒体时代涉警网络舆情的应对研究[D];华南理工大学;2019年

6 罗峰;大数据时代公共危机事件网络舆情的形成与演变[D];华南理工大学;2019年

7 曹兴云;基于汽车网络舆情的数据分析系统研究与应用[D];上海交通大学;2018年

8 郑靖雯;医患事件的网络舆情演变研究[D];长春理工大学;2019年

9 孙恬;公共卫生事件的网络舆情分析及应对[D];华中师范大学;2019年

10 任仕贤;旅游网络舆情政府回应效能对城市形象修复影响研究[D];电子科技大学;2019年



本文编号:2870805

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2870805.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c7884***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com