基于Spark的海量少数民族文化资源数据挖掘研究
【图文】:
Spark 运行框架rk 相对于 MapReduce 的优势不仅体现在基于内存的性能上,更架集成了更多的子项目[56],包括Spark SQL(交互式操作)、Spark )、MachineLearning lib(机器学习库)、Graphx(并行图计算库)。S图 2.2 所示:rk 的核心是其计算逻辑,提供了多种组件,运行在通用平台上SparkSQL 可实现对数据库的操作,主要分 3 步处理;第一步 DataFrame 中提供的方法存储在内存中,它支持多种格式的数用 SQLContext 类;第二步数据处理可以实现各种算法,主ntext 类,完成 hive 数据库的操作;第三步结果输入是把计算的部存储文件。Machine Learnig lib 是常用机器学习库的算法实现ng 会不断接收从接收器发送来的数据流,把时间片内的数据打包
图 2.3 Spark运行模式riverProgram 是 Spark 的一个应用程序,负责对整个集群的监控,节点;它通过 SparkContext 来连接整个集群,包含 main 函数,是操作的接口。ClusterManager 负责分配程序运行所需要的资源和保正常运行;Worker 是集群的计算节点,存在于每个 Slave 中,rManager 的命令,并以周期性的心跳机制向 ClusterManager 汇报集。每个 Worker 可以单独的运行,,接收到一个作业,将其划分为多个Executor 进程进行计算或者数据的存储。DriverProgram 创建进程时 DAGScheduler 和 TaskScheduler;DAGScheduler 属于高层调度模ffle 将作业划分为不同的 Stage,同时会根据 Partition 构造每个 Sta任务,然后以任务组的形式交由 TaskScheduler 具体执行。2.5 YARN 资源管理器
【学位授予单位】:云南师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G122;TP311.13
【参考文献】
相关期刊论文 前10条
1 董春涛;李文婷;沈晴霓;吴中海;;Hadoop YARN大数据计算框架及其资源调度机制研究[J];信息通信技术;2015年01期
2 黄永林;;数字化背景下非物质文化遗产的保护与利用[J];文化遗产;2015年01期
3 林乐波;陈鲁峰;;网络教研:引领教研的“新引擎”[J];基础教育参考;2013年24期
4 刘鹏;孟炎;吴艳艳;宋丹娃;;聚类分析和孤立点技术在网络安全态势中的应用[J];网络安全技术与应用;2013年03期
5 饶君;吴斌;东昱晓;;MapReduce环境下的并行复杂网络链路预测[J];软件学报;2012年12期
6 李宗天;;浅谈如何保护和传承朝鲜族传统音乐文化[J];品牌(理论月刊);2010年11期
7 华铨平;;面向数据特征的分布式数据挖掘研究[J];计算机工程与设计;2010年06期
8 王沁;李磊;陆成勇;孙富明;;平均计算时间复杂度优化的动态粒子群优化算法[J];计算机科学;2010年03期
9 王月;柴瑞敏;;减聚类的模糊C-均值算法在文本分类中的应用[J];计算机系统应用;2010年03期
10 吴建平;王耀希;代红兵;;文化遗产数字化应用平台的技术构建[J];计算机应用研究;2006年08期
相关博士学位论文 前4条
1 卫守林;分布式天文海量数据处理与控制研究[D];中国科学院大学(中国科学院云南天文台);2017年
2 黄家周;文化建设视域下民族地区马克思主义大众化的路径研究[D];西南交通大学;2015年
3 王锐;数字博物馆资源虚拟化与数据集成方法研究[D];山东大学;2010年
4 李明;智能优化排样技术研究[D];浙江大学;2006年
相关硕士学位论文 前10条
1 赵海燕;基于卷积神经网络的民族服饰图像教育资源检索研究[D];云南师范大学;2018年
2 韩浩;基于云计算的钓鱼网站检测研究[D];中国矿业大学;2018年
3 邓家璧;模拟移动床分离过程的控制与优化方法研究[D];沈阳化工大学;2018年
4 钱雅伦;基于智能算法的配电网故障自愈方法研究[D];华北电力大学;2018年
5 冯亮亮;基于Hadoop的MapReduce性能优化研究[D];南京邮电大学;2017年
6 陈萌;分布式视频快速识别分析系统设计与实现[D];西安电子科技大学;2017年
7 何亚南;基于时序动态描述逻辑的民族文化资源知识表示形式化模型研究[D];云南师范大学;2017年
8 吴稀钰;基于Spark的谱聚类算法及其在QAR数据中的应用[D];中国民航大学;2017年
9 刘四平;多源数据融合的协同过滤算法研究[D];湖南大学;2017年
10 陈慧丽;云计算环境下静态任务调度机制研究[D];武汉理工大学;2017年
本文编号:2697501
本文链接:https://www.wllwen.com/shekelunwen/wenhuayichanlunwen/2697501.html