当前位置:主页 > 管理论文 > 社区管理论文 >

TensorFlow平台深度学习任务的资源调度问题研究

发布时间:2021-06-11 12:19
  从AlphaGo与人类对弈以来,人工智能得到了极大的发展。从语音识别领域的语音助手,计算机视觉应用中的人脸识别,自然语言处理的机器翻译等多方面给我们带来便利,这依靠的是深度学习技术。深度学习的过程需要进行神经网络的构建和训练数据特征的提取,借鉴人脑结构特点通过将大规模的数据在多层神经网络上不断的训练,从多层的训练中不断得到抽象程度更高的数据特征,便于复杂问题的解决,带给深度学习巨大的发展空间。各大计算机巨头也纷纷开源其深度学习框架例如Caffe、Torch、MXNet。其中Google的Tensor Flow因其高可用,工作流程简单,社区支持活跃而优势很大。深度学习投入应用仅仅依靠TensorFlow来进行模型训练是不够的,应用过程要考虑到数据的存储与处理、资源的管理和调度、应用的部署等方面。同时深度学习训练过程资源消耗大,更需要合理的调度。为此,需要借助云计算相关技术搭建云深度学习平台,通过虚拟化技术实现资源的统一管理,通过集成各种框架保证深度学习应用的正常运行。为了提升深度学习任务训练过程的资源利用率,本文从以下两个方面展开,进行了分析和论证:(1)改进粒子群算法应用到云深度学习平... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:80 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 论文主要工作
    1.4 论文组织结构
第二章 相关技术介绍
    2.1 深度学习相关技术
        2.1.1 深度学习
        2.1.2 TensorFlow深度学习框架
    2.2 云计算相关技术
        2.2.1 云计算架构
        2.2.2 虚拟化技术
        2.2.3 云计算体系结构和资源调度模型
    2.3 典型的资源调度算法
    2.4 本章小结
第三章 改进粒子群算法
    3.1 启发式算法
    3.2 粒子群算法
        3.2.1 粒子群算法的数学描述
        3.2.2 粒子群算法的实现
        3.2.3 粒子群算法的参数与组成分析
        3.2.4 粒子群算法的优缺点
    3.3 粒子群算法的改进
    3.4 改进粒子群算法的性能分析
    3.5 粒子群算法应用资源调度的可行性分析
    3.6 本章小结
第四章 资源调度策略分析与设计
    4.1 TensorFlow深度学习任务分析
        4.1.1 深度学习应用思路
        4.1.2 深度学习的主资源分析
        4.1.3 深度学习任务的执行时间预估
        4.1.4 TensorFlow模型的保存与恢复
    4.2 调度算法的性能评价指标
    4.3 云深度学习平台的资源调度算法
        4.3.1 调度问题描述
        4.3.2 适应度函数
        4.3.3 粒子的编码方式
        4.3.4 粒子初始化过程
        4.3.5 应用算法的执行流程
    4.4 GPU服务器的资源调度策略
        4.4.1 GPU的硬件指标
        4.4.2 TensorFlow使用GPU的方式
        4.4.3 GPU服务器的资源调度策略
    4.5 本章小结
第五章 实验验证与分析
    5.1 CloudSim概述
        5.1.1 CloudSim体系结构
        5.1.2 CloudSim系统的调度模型
        5.1.3 仿真实验的实现过程
    5.2 改进后的粒子群算法在云平台资源调度的应用
        5.2.1 实验环境
        5.2.2 实验结果与分析
    5.3 多卡多任务下GPU资源调度策略
        5.3.1 实验环境
        5.3.2 实验结果分析
    5.4 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
致谢
参考文献


【参考文献】:
期刊论文
[1]大数据与云计算[J]. 何清.  科技促进发展. 2014(01)
[2]云计算:体系架构与关键技术[J]. 罗军舟,金嘉晖,宋爱波,东方.  通信学报. 2011(07)
[3]惯性权值对粒子群算法收敛性的影响及改进[J]. 黄翀鹏,熊伟丽,徐保国.  计算机工程. 2008(12)
[4]蚁群算法理论及应用研究的进展[J]. 段海滨,王道波,朱家强,黄向华.  控制与决策. 2004(12)
[5]具有变异特征的蚁群算法[J]. 吴庆洪,张纪会,徐心和.  计算机研究与发展. 1999(10)

硕士论文
[1]基于多GPU的多层神经网络并行加速训练算法的研究[D]. 毕占甲.哈尔滨工业大学 2015



本文编号:3224522

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/shequguanli/3224522.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ed7cf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com