深度学习模型的可视化设计及实现
发布时间:2022-01-18 23:58
近年来人工智能技术得到了快速发展,深度学习作为人工智能研究领域的一个重要方法,在人脸识别、图像分类等方面取得了许多突破性的进展,但同时面临着模型结构复杂、参数量级高、测试数据量大等难题,在一定程度上限制了深度学习方法的快速推广。深度学习的可视化技术能够提升神经网络的可读性,简化网络的理解过程,可以加快深度学习领域的研究进展,然而现有的可视化技术只能实现网络结构的图形化,存在功能单一、框架依赖度高等缺点,使得深度学习算法研究的有效性受到抑制。为了有效提升深度学习算法研究的快速性和便捷性,论文在探索网络模型训练与分析的可视化方案基础上,提出了一种针对Caffe深度学习架构的网络编辑与模型训练分析的可视化解决方案CaffePanel。论文主要工作有以下几点:(1)独创地设计了Caffe框架在Web平台上的网络解析与图形化编辑模型,融合模板语法特性与虚拟文档思想优化图形化速度,提出高速Caffe网络可视化与编辑机制;(2)结合前后端交互技术形成了可视化、可监控的Caffe网络训练调试机制,针对网络训练过程中的收敛性进行研究,设计了一种网络隐藏层的收敛性评估算法;(3)CaffePanel方案的...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
010~2016年NIPS投稿论文数量[7]
第一章绪论31.2国内外研究现状深度学习涉及的数据十分庞大,层次结构非常复杂,因此不论是对训练结果的研究,还是对每个卷积层滤波效果的分析都存在一定的困难。同时复杂的网络模型仅通过文本开发的方式,也难以确保开发人员编辑的准确性,更难以让其他人员快速理解网络模型结构。可视化方法通过对模型和数据进行统计与转换,生成易于理解的结果报告,可便于开发人员进行快速学习与改进。因此,深度学习可视化一直是该领域内的一个重要的研究方向。(1)可视化。深度学习的可视化研究和开发主要分为两大类:1、网络模型可视化/2、训练、预测的数据可视化。针对网络模型的可视化,不同的深度学习框架集成了各自特有的的可视化方案。目前主流的深度学习框架都有自带的专有可视化工具,如TensorFlow[11]使用TensorBoard,Keras[12]使用graphviz进行可视化,具有本地分割模型、生成网络框图等功能,便于开发者理解网络模型的整体结构。TensorBoard是谷歌发布的TensorFlow深度学习框架的可视化插件。Tensor意为流动的张量,从图1-2中,使用者能够直接地看到数据在设计的模型中是如何流动的,从而理解流动张量的意义。对于训练、预测的数据可视化,目前主要采用经典的可视化工具,如OpenCV,Matlab等。这类工具发展相对完善,不论在C++、Python还是java语言下都有相对应的移植库,OpenCV更是图像方面深度学习必不可少的工具之一,很多模型中都需要使用OpenCV对数据集进行预处理[13]。然而对于初学者来说使用上相对麻烦,不仅需要自己图1-2Tensorboard模型可视化网络
东南大学硕士学位论文4从框架中提取出数据,还需要自己通过大段代码实现所需功能,从而增加了额外的学习成本。图1-3展示了对训练过程模型损失的可视化分析。图1-3训练过程模型损失的数据可视化(2)基于Web平台的可视化研究。随着互联网的高速发展,Web平台凭借其高兼容、无需安装直接运行的特性,吸引越来越多的应用转移到Web端进行开发,在Web平台上,基于点图模块Canvas和可缩放矢量图形(SVG),诞生了众多的可视化工具,如最常用的D3js,此外还有更多的集成库在D3js的基础上进一步封装,共同构建出符合应用需要的开发页面[14]。因此,针对深度学习理论和技术使用Web平台进行可视化开发技术正处在快速发展中。(3)深度学习框架(Caffe)在Web平台上的可视化研究现状Caffe作为一款开源的深度学习框架,与其他框架相比代码开源,训练加速效果较好,上手更加快速,社区更成熟,是目前较为主流经典的一种,得到了广泛地运用,因此有更多的开发者基于Caffe进行深度学习的可视化研究,针对Caffe深度学习框架的Web可视化研究已有一定的进展[15]。目前运用较广泛的是一个Web平台上的模型分析工具NetScope,它能在Web上分析Caffe框架的模型,并进行可视化排列。在github上也出现了其他开发者对NetScope的拓展,主要是添加了网络层的参数分析。NetScope对模型的解析,采用了ChristophKrner的prototxt-parser库,ChristophKrner自己在2017年末也完成过Caffejs的设计[16]。Caffejs不仅利用了NetScope的部分功能,它还整合了convnetjs,实现了在线预测,通过下载训练好的分类模型,用Web浏览器来预测图片内容。尽管如此,现有Caffe的可视化方案还存在许多不足之处,比如只能实现网络结构的图形化,存在功能单一、框架依赖度高等缺点,使得深度学习算
【参考文献】:
期刊论文
[1]基于MongoDB的数据分片与分配策略研究[J]. 熊峰,刘宇. 计算机与数字工程. 2019(04)
[2]基于Python语言及Flask框架的微机实验室管理系统设计与实现[J]. 艾缨东,李建兵,韩英杰. 信息与电脑(理论版). 2019(06)
[3]基于Web的数据可视化教学系统设计与实现[J]. 刘霞,张威. 电子设计工程. 2019(05)
[4]基于卷积神经网络图像识别算法的加速实现方法[J]. 秦东辉,周辉,赵雄波,柳柱. 航天控制. 2019(01)
[5]基于Python的数据分析概述[J]. 翟高粤. 甘肃科技纵横. 2018(11)
[6]2018年核心信息技术展望[J]. 樊凯. 互联网经济. 2018(Z1)
[7]Web前端开发技术的演化与MVVM设计模式研究[J]. 李嘉,赵凯强,李长云. 电脑知识与技术. 2018(02)
[8]深度学习算法在智能装备中的应用[J]. 沈玉玲,杨俊杰,丘盛昌. 装备机械. 2017(04)
[9]Python语言的Web开发应用[J]. 朱贇. 电脑知识与技术. 2017(32)
[10]深度学习在目标视觉检测中的应用进展与展望[J]. 张慧,王坤峰,王飞跃. 自动化学报. 2017(08)
本文编号:3595837
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
010~2016年NIPS投稿论文数量[7]
第一章绪论31.2国内外研究现状深度学习涉及的数据十分庞大,层次结构非常复杂,因此不论是对训练结果的研究,还是对每个卷积层滤波效果的分析都存在一定的困难。同时复杂的网络模型仅通过文本开发的方式,也难以确保开发人员编辑的准确性,更难以让其他人员快速理解网络模型结构。可视化方法通过对模型和数据进行统计与转换,生成易于理解的结果报告,可便于开发人员进行快速学习与改进。因此,深度学习可视化一直是该领域内的一个重要的研究方向。(1)可视化。深度学习的可视化研究和开发主要分为两大类:1、网络模型可视化/2、训练、预测的数据可视化。针对网络模型的可视化,不同的深度学习框架集成了各自特有的的可视化方案。目前主流的深度学习框架都有自带的专有可视化工具,如TensorFlow[11]使用TensorBoard,Keras[12]使用graphviz进行可视化,具有本地分割模型、生成网络框图等功能,便于开发者理解网络模型的整体结构。TensorBoard是谷歌发布的TensorFlow深度学习框架的可视化插件。Tensor意为流动的张量,从图1-2中,使用者能够直接地看到数据在设计的模型中是如何流动的,从而理解流动张量的意义。对于训练、预测的数据可视化,目前主要采用经典的可视化工具,如OpenCV,Matlab等。这类工具发展相对完善,不论在C++、Python还是java语言下都有相对应的移植库,OpenCV更是图像方面深度学习必不可少的工具之一,很多模型中都需要使用OpenCV对数据集进行预处理[13]。然而对于初学者来说使用上相对麻烦,不仅需要自己图1-2Tensorboard模型可视化网络
东南大学硕士学位论文4从框架中提取出数据,还需要自己通过大段代码实现所需功能,从而增加了额外的学习成本。图1-3展示了对训练过程模型损失的可视化分析。图1-3训练过程模型损失的数据可视化(2)基于Web平台的可视化研究。随着互联网的高速发展,Web平台凭借其高兼容、无需安装直接运行的特性,吸引越来越多的应用转移到Web端进行开发,在Web平台上,基于点图模块Canvas和可缩放矢量图形(SVG),诞生了众多的可视化工具,如最常用的D3js,此外还有更多的集成库在D3js的基础上进一步封装,共同构建出符合应用需要的开发页面[14]。因此,针对深度学习理论和技术使用Web平台进行可视化开发技术正处在快速发展中。(3)深度学习框架(Caffe)在Web平台上的可视化研究现状Caffe作为一款开源的深度学习框架,与其他框架相比代码开源,训练加速效果较好,上手更加快速,社区更成熟,是目前较为主流经典的一种,得到了广泛地运用,因此有更多的开发者基于Caffe进行深度学习的可视化研究,针对Caffe深度学习框架的Web可视化研究已有一定的进展[15]。目前运用较广泛的是一个Web平台上的模型分析工具NetScope,它能在Web上分析Caffe框架的模型,并进行可视化排列。在github上也出现了其他开发者对NetScope的拓展,主要是添加了网络层的参数分析。NetScope对模型的解析,采用了ChristophKrner的prototxt-parser库,ChristophKrner自己在2017年末也完成过Caffejs的设计[16]。Caffejs不仅利用了NetScope的部分功能,它还整合了convnetjs,实现了在线预测,通过下载训练好的分类模型,用Web浏览器来预测图片内容。尽管如此,现有Caffe的可视化方案还存在许多不足之处,比如只能实现网络结构的图形化,存在功能单一、框架依赖度高等缺点,使得深度学习算
【参考文献】:
期刊论文
[1]基于MongoDB的数据分片与分配策略研究[J]. 熊峰,刘宇. 计算机与数字工程. 2019(04)
[2]基于Python语言及Flask框架的微机实验室管理系统设计与实现[J]. 艾缨东,李建兵,韩英杰. 信息与电脑(理论版). 2019(06)
[3]基于Web的数据可视化教学系统设计与实现[J]. 刘霞,张威. 电子设计工程. 2019(05)
[4]基于卷积神经网络图像识别算法的加速实现方法[J]. 秦东辉,周辉,赵雄波,柳柱. 航天控制. 2019(01)
[5]基于Python的数据分析概述[J]. 翟高粤. 甘肃科技纵横. 2018(11)
[6]2018年核心信息技术展望[J]. 樊凯. 互联网经济. 2018(Z1)
[7]Web前端开发技术的演化与MVVM设计模式研究[J]. 李嘉,赵凯强,李长云. 电脑知识与技术. 2018(02)
[8]深度学习算法在智能装备中的应用[J]. 沈玉玲,杨俊杰,丘盛昌. 装备机械. 2017(04)
[9]Python语言的Web开发应用[J]. 朱贇. 电脑知识与技术. 2017(32)
[10]深度学习在目标视觉检测中的应用进展与展望[J]. 张慧,王坤峰,王飞跃. 自动化学报. 2017(08)
本文编号:3595837
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3595837.html
最近更新
教材专著