基于大数据的智能交通运输平台的研究
本文选题:智能交通 + 数据挖掘 ; 参考:《成都理工大学》2014年硕士论文
【摘要】:随着交通基础服务设施的完善和数据采集系统的多样化,交通系统中的数据量正处于急剧增长的状态,智能交通系统的大数据时代已经到来。交通系统是一个实时的、多变的系统,随着数据量的增多,传统方式处理交通数据已经满足不了我们的需求,尤其是过高的延时性与较低准确性在实时路况预测和路线最优引导方面表现非常差;而使用云存储可以使海量数据的存储成本变得低廉的同时又增加了数据的安全性,使用云计算处理海量数据可以达到最高效的利用现有资源来快速处理数据,所以使用云平台来存储计算智能交通中的海量数据是最佳的选择之一。 在众多的云处理平台中,,Hadoop平台以其体系完整、开源的特点成为主流的云平台之一,Hadoop可以充分利用大量廉价的服务器集群来完成对海量数据的快速并行处理。其核心组件包括分布式文件系统HDFS和并行化计算模型MapReduce,分布式文件系统提供安全可靠的高效存储访问能力,MapReduce提供了对海量数据的并行处理能力,这使得我们可以利用Hadoop平台高效的处理智能交通系统中的海量数据挖掘问题。虽然MapReduce框架有一些缺陷,例如单点故障概率高,资源利用率低,但是其升级版YARN很好的解决了这个问题,所以Hadoop平台在智能交通系统中的应用前景是非常广阔的。 本文通过对交通系统的分析,发现比较常用的功能实时路况预测以及路线引导相关性比较大,所以本文使用基于历史数据的方法来对路况进行预测并使用预测结果对路段进行动态的赋值,然后再使用相关的单源最短路径算法来模拟最优路径,虽然这种方式使得计算量大大增加,例如动态赋值操作需要对所有路段进行基于历史数据的实时预测方法,但是,本文使用Hadoop平台很好的解决了计算量的问题。 通过对数据挖掘在Hadoop下的应用优势的分析研究,在基于历史数据的实时路况预测系统中,本文使用KNN算法进行数据挖掘,将实时路况与历史数据模型进行匹配来预测路况,而KNN算法则使用MapReduce计算模型来实现并行化,以减少数据处理时间;最优路径选择的问题中,本文使用基于MapReduce的并行单源最短路径算法以达到更高的效率。最后对云平台应用到智能交通系统的框架进行了分析设计,系统分为四层五部分,每一层都独立向上层提供服务,这样对提高数据的利用率有很大帮助,另外为了对数据更加高效的存储处理,在使用云存储的同时还使用传统数据进行数据存储,以达到更高的效率。 最后对基于MapReduce的并行KNN算法在路况预测以及并行单源最短路径算法在最优路径的应用进行了模拟测试,通过对比测试证明利用Hadoop集群对提升智能交通的性能有很大帮助。
[Abstract]:With the improvement of transportation infrastructure and the diversification of data acquisition system, the data volume in the transportation system is in a state of rapid growth. The big data era of intelligent transportation system has come. Traffic system is a real-time, changeable system, with the increase of data, the traditional way of handling traffic data has been unable to meet our needs. Especially, too high delay and low accuracy are very poor in real-time road condition prediction and route optimal guidance, and cloud storage can make the storage cost of mass data low and increase the security of data at the same time. Using cloud computing to process large amounts of data can achieve the most efficient use of existing resources to quickly process data, so using cloud platform to store the mass data in intelligent transportation is one of the best options. Among many cloud processing platforms, Hadoop platform is one of the mainstream cloud platforms with its complete architecture and open source. Hadoop can make full use of a large number of cheap server clusters to complete the fast parallel processing of massive data. Its core components include distributed file system (HDFS) and parallel computing model MapReduce.The distributed file system provides secure and reliable storage access capability and MapReduce provides parallel processing capability for massive data. This enables us to use Hadoop platform to efficiently deal with the problem of mass data mining in intelligent transportation systems. Although the MapReduce framework has some defects, such as high single point failure probability and low resource utilization, its upgraded version YARN solves this problem very well, so the Hadoop platform has a very broad application prospect in its. Based on the analysis of traffic system, this paper finds that the function of real-time road condition prediction and route guidance is more relevant. So this paper uses the method based on historical data to predict the road condition and uses the forecast result to assign the dynamic value to the section, then uses the correlation single source shortest path algorithm to simulate the optimal path. Although this method greatly increases the computational complexity, for example, the dynamic assignment operation requires a real-time prediction method based on historical data for all sections, but the Hadoop platform is used in this paper to solve the problem of computational complexity. Based on the analysis of the advantages of data mining in Hadoop, in the real-time road condition prediction system based on historical data, this paper uses the KNN algorithm for data mining, matches the real-time road condition with the historical data model to predict the road condition. The KNN algorithm uses MapReduce computing model to realize parallelization to reduce data processing time. In the problem of optimal path selection, this paper uses MapReduce based parallel single-source shortest path algorithm to achieve higher efficiency. Finally, the framework of cloud platform applied to intelligent transportation system is analyzed and designed. The system is divided into four layers and five parts, each layer provides services to the upper layer independently, which is helpful to improve the utilization rate of data. In addition, in order to store the data more efficiently, the traditional data is stored simultaneously with cloud storage, so as to achieve higher efficiency. Finally, the parallel KNN algorithm based on MapReduce and the application of parallel single source shortest path algorithm in optimal path are simulated and tested. It is proved that using Hadoop cluster is very helpful to improve the performance of intelligent traffic.
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:U495;TP311.13
【相似文献】
相关期刊论文 前10条
1 孙志伟;;大数据时代中小企业的应对策略[J];未来与发展;2013年10期
2 ;大数据的崛起:趋势、机遇与挑战[J];互联网周刊;2013年24期
3 邓春宇;郭阳;李俊妮;王伯伊;;大数据在县级供电公司中的应用[J];农村电气化;2014年03期
4 李晓辉;王淑艳;;大数据及其挑战[J];科技风;2012年23期
5 严霄凤;张德馨;;大数据研究[J];计算机技术与发展;2013年04期
6 赵敬;;大数据在日本的发展及应用[J];声屏世界;2013年11期
7 孟小峰;高宏;;大数据专题前言[J];软件学报;2014年04期
8 金保印;;迎接“大数据”时代[J];民营科技;2013年03期
9 Peter Liu;;电信行业中的大数据[J];电信网技术;2013年08期
10 侯冬梅;谷雨;谷新胜;;大数据在科技、教育与信息领域的应用[J];计算机教育;2014年01期
相关会议论文 前5条
1 李田;郭利;冯鹏;;某型导弹单元设备自动检测系统软件设计[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
2 高世光;邓苏;王长缨;;关于ADO+引导数据种类的演变的研究[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
3 颜涯;邵佩英;;GIS与MIS系统集成技术在城市规划中的应用[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 谢国忠;;大数据时代下的企业管理与创新[A];创新驱动:新机遇 新挑战——2013年全国企业管理创新大会资料汇编[C];2013年
5 王甫棣;祝婷;;气象传输交换控制元数据的设计与实现[A];第31届中国气象学会年会S13 气象通信与信息技术应用实践与新技术探索[C];2014年
相关重要报纸文章 前10条
1 ;精简企业数据是时候了[N];计算机世界;2008年
2 光大证券;“大数据”或成重要投资主线[N];中国证券报;2012年
3 本报记者 郭涛 李奕;与大数据打交道的那些人[N];中国计算机报;2012年
4 本报记者 齐洁;大数据蕴藏创业空间[N];中国经营报;2012年
5 吴勇毅;大数据“热”下的“冷”思考[N];中国冶金报;2012年
6 抚苏;众望所归,大数据时代来临[N];电脑报;2013年
7 《网络世界》记者 于翔;大数据的价值实现之旅[N];网络世界;2013年
8 本报记者 孙琦子;这些年,一起忽悠着的“大数据”[N];经济观察报;2013年
9 中国科学技术发展战略研究院 许晔;大数据时代来袭 中国宜加紧布局[N];经济参考报;2013年
10 记者 李成成;崭露头角的大数据时代[N];企业家日报;2013年
相关博士学位论文 前5条
1 张兰廷;大数据的社会价值与战略选择[D];中共中央党校;2014年
2 李琦;基于多源数据的交通状态监测与预测方法研究[D];吉林大学;2013年
3 张新;区域性防灾减灾信息服务体系研究[D];中国科学院研究生院(遥感应用研究所);2006年
4 李智慧;基于可视化的三维放射治疗计算机模拟系统的研究[D];四川大学;2002年
5 袁培森;基于LSH的Web数据相似性查询研究[D];复旦大学;2011年
相关硕士学位论文 前10条
1 刘伟;基于元数据的数据质量控制与评估模型研究[D];东北石油大学;2011年
2 芦倩;基于ArcGIS Engine的水文生态数据管理系统设计与实现[D];北京林业大学;2011年
3 刘伟;光纤资源网GIS管理的数据挖掘研究[D];吉林大学;2004年
4 唐铁虎;基于Web服务的企业基础数据服务中心研究[D];哈尔滨工程大学;2012年
5 向华;湖北省极端天气气候事件监测系统的设计与实现[D];电子科技大学;2013年
6 黄刚;基于SOA的油田WebGIS研究与实现[D];大庆石油学院;2008年
7 蔡磊;新疆沙漠化监测预警系统研究[D];新疆大学;2011年
8 冯勰;基于Oracle的测井数据库的设计与研究[D];吉林大学;2006年
9 马文惠;基于决策支持的棉库管理系统研究[D];华北电力大学;2011年
10 贾艳秋;基于GIS的农业宏观决策支持系统研究[D];北京林业大学;2007年
本文编号:2114798
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2114798.html