公共交通运营大数据聚类分析方法及应用研究
【学位单位】:武汉轻工大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:U491.17;TP311.13
【部分图文】:
DataNodes上执行此工作任务。如是,NameNode和JobTracker是为管理者,??DataNodes和TaskTrackers是为工作者,共同配合完成任务的执行操作[27〗。??Hadoop集群的整体部署架构如图2-2所示:??Master??NameNode?JobTracker??U=q==#=zczd_??、、、】?、、■'、??Slave?Slave?Slave??■?????,??私’?^?、冷?\??DataNode?TaskTracker?DataNode?TaskTracker?DataNode?TaskTracker??图2-2?Hadoop集群的整体部署架构??12??
(分布式文件系统)?I??图2-1?Hadoop生态系统图??2_?3.?3?Hadoop工作架构??Hadoop是一个Map?/?Reduce框架,运作在HDFS或HBase?(列式存储数据??库)上。其本质是将一个整体较为复杂的工作分割成为若干单独的任务,分割的??小任务能够同时在不同的数据节点上运行。每个被分割的小任务在Map阶段执??行并行运算,最后在Reduce阶段合并运行的结果。??Hadoop集群采用了?Master/Slaves?(主从结构)的架构设计,NameNode?(名??称节点)是Master(主服务器),DataNode?(数据节点)是Slave(从服务器)。??NameNode和DataNodes负责处理HDFS的工作,其中,NameNode负责管理文??件系统的名称空间及外部用户访问的控制,DataNodes则响应来自HDFS和??NameNode的命令。??JobTracker?和?TaskTrackers?共同完成?MapReduce?的工作
DataNode响应来自文件系统用户的请求并且提供数据读写服务。同时,DataNode??基于NameNode执行数据块创建,删除和冗余备份等工作。??客户端、DataNode以及NameNode三者之间的交互关系如图2-3所示:??NameNode?Metadata?(Name.?Replicas...)??元数据操^名称节点?—存储元数描??---??、客户端j?\??:广??读/?\??.....1???????\?_丨.丨丨..i?丨丨丨_??DataNode?DataNode??数据锯节点?)?数据据节点??\m?\?\mm\?????????……????机架1?\?/?机架2??写\?,?一、、、/写??图2-3?HDFS架构图??2.?5?MapReduce??2.?5.?1?MapReduce?概述??Hadoop另一个重要组成部分MapReduce是一个并行编程模型,它可以并行??的处理上TB级海量的大数据集,并且具有非常好的可靠性及容错性。MapReduce??数据集的整体处理过程可以分成为两个部分,即任务的分解和结果的汇总。在任??务处理过程中,MapReduce将海量数据集的操作分发给主节点下的各个子节点,??然后整合各子节点的处理结果分而治之共同完成数据
【参考文献】
相关期刊论文 前10条
1 吴腾奇;;智能交通系统构成及发展研究[J];汽车工业研究;2015年12期
2 陆化普;孙智源;屈闻聪;;大数据及其在城市智能交通系统中的应用综述[J];交通运输系统工程与信息;2015年05期
3 李正熙;;中国城市智能交通系统产业化发展趋势[J];自动化博览;2015年07期
4 段桂芹;;基于均值与最大距离乘积的初始聚类中心优化K-means算法[J];计算机与数字工程;2015年03期
5 董春涛;李文婷;沈晴霓;吴中海;;Hadoop YARN大数据计算框架及其资源调度机制研究[J];信息通信技术;2015年01期
6 谢然;;大数据社会的具体场景[J];互联网周刊;2014年22期
7 杨铭;;数据挖掘中聚类算法的分析与研究[J];网友世界;2014年15期
8 刘智慧;张泉灵;;大数据技术研究综述[J];浙江大学学报(工学版);2014年06期
9 赵清;唐菁;;电信业数据仓库体系结构及关键技术研究[J];信息通信技术;2013年06期
10 王德青;朱建平;谢邦昌;;主成分聚类分析有效性的思考[J];统计研究;2012年11期
相关博士学位论文 前1条
1 高联雄;智能公交系统数据挖掘研究与应用[D];北京邮电大学;2011年
相关硕士学位论文 前9条
1 苏金;基于Hadoop的物流历史数据聚类挖掘研究[D];西安工业大学;2017年
2 何晴;基于聚类的多层关联规则挖掘算法研究与改进[D];上海师范大学;2017年
3 黄亚萍;基于聚类分析的电子商务客户细分系统的设计与实现[D];江苏科技大学;2016年
4 刘越;K-means聚类算法的改进[D];广西师范大学;2016年
5 万旭;基于Hadoop平台的聚类算法研究[D];西安电子科技大学;2016年
6 宋媛;聚类分析中确定最佳聚类数的若干问题研究[D];延边大学;2013年
7 李存琛;海量数据分布式存储技术的研究与应用[D];北京邮电大学;2013年
8 袁勇;公交IC卡数据挖掘技术及应用研究[D];吉林大学;2009年
9 张涤;基于文化算法的聚类分析研究[D];西南交通大学;2008年
本文编号:2856572
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2856572.html