当前位置:主页 > 科技论文 > 计算机论文 >

基于异构智能处理单元的自主可控人工智能处理平台

发布时间:2021-05-25 09:38
  人工智能技术已逐步进入人们的生活,随着网络的广泛应用,人工智能技术已经渗透到各行各业。随着人工智能技术中算法的规模和复杂性不断增加,传统的计算架构已经难以满足当前海量的数据计算需求,因此,人们开始构建新的计算架构来提升人工智能处理平台的性能。为了提高人工智能处理平台的计算性能,本文首先设计了国产兆芯-FPGA人工智能处理平台,本文解决了兆芯CPU与多块DE10-Standard开发板数据传输的问题,并通过硬件描述语言设计了浮点数矩阵乘法系统,最后在此系统中实现了一组浮点矩阵的乘法运算。为了更好的利用国产兆芯-FPGA中硬件资源并实现更高的性能,本文设计了一种深度流水的OpenCL内核加速系统框架,这种框架能够跨越算法中的不同层执行加速操作,而无需重新对FPGA进行编程。本设计主要针对YOLOv2算法中的卷积层、池化层和归一化层进行并行加速。由于本文工作是首次针对国产兆芯-FPGA基于OpenCL的YOLOv2算法加速系统的研究,为了与其他基于高端FPGA的设计进行比较,本文分别在Xilinx Zynq-7000 FPGA的加速系统平台和本文设计的加速系统平台上分别进行手写体识别的试验,... 

【文章来源】:中国电子科技集团公司电子科学研究院北京市

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
注释表
缩略词
第一章 绪论
    1.1 引言
    1.2 研究意义
    1.3 研究现状
        1.3.1 异构处理平台
        1.3.2 人工智能算法
        1.3.3 异构编程框架
    1.4 本文研究内容
第二章 人工智能处理平台设计
    2.1 处理平台整体架构设计
    2.2 处理平台的通信方式设计
    2.3 基于FPGA逻辑的浮点数矩阵乘法优化设计
    2.4 本章小结
第三章 基于人工智能处理平台的优化算法实现
    3.1 YOLOv2算法简介
    3.2 YOLOv2并行计算设计
        3.2.1 算法加速整体框架
        3.2.2 卷积层加速
        3.2.3 池化层加速
        3.2.4 归一化层加速
    3.3 本章小结
第四章 实验与分析
    4.1 实验环境
    4.2 实验方案
        4.2.1 本平台未使用并行加速的实验测试
        4.2.2 本平台使用并行加速的实验测试
        4.2.3 其他FPGA平台加速的实验测试
    4.3 实验结论与分析
    4.4 本章小结
第五章 结论与展望
    5.1 研究结论
    5.2 展望
参考文献
致谢
在学期间发表的学术论文及取得的研究成果


【参考文献】:
期刊论文
[1]基于深度学习的场景数字检出[J]. 王璠,丁军航,徐世许.  制造业自动化. 2019(03)
[2]基于深度学习的复杂背景下茶叶嫩芽检测算法[J]. 孙肖肖,牟少敏,许永玉,曹旨昊,苏婷婷.  河北大学学报(自然科学版). 2019(02)
[3]基于TINY-YOLO的嵌入式人脸检测系统设计[J]. 游忍,周春燕,刘明华,邵延华,展华益.  工业控制计算机. 2019(03)
[4]Attention-YOLO:引入注意力机制的YOLO检测算法[J]. 徐诚极,王晓峰,杨亚东.  计算机工程与应用. 2019(06)
[5]基于YOLO的小型动物识别系统设计[J]. 周文萱,胡龙桃,张敏,方宇涛,李欣钰.  计算机时代. 2019(03)
[6]基于流水线高斯粒子滤波的无人机姿态估计算法及FPGA实现[J]. 王义平,王佳辉,薛雅丽.  电光与控制. 2019(02)
[7]基于FPGA的嵌入式通信系统核心模块设计[J]. 杨胜利,李超,余亮.  现代电子技术. 2018(22)
[8]基于GPS的智能车自动驾驶系统的研制[J]. 李延斌,牛雷,佟贺.  电子产品世界. 2018(11)
[9]谷歌Tensorflow框架在自动驾驶汽车车辆识别功能中的应用[J]. 吴丽华.  汽车实用技术. 2018(20)
[10]PCB板级电路中高效散热结构的优化设计[J]. 刘维红,李丹.  半导体光电. 2018(05)

博士论文
[1]CPU-GPGPU共享最后一级缓存架构中的数据共享优化研究[D]. 俞立呈.浙江大学 2018
[2]混合异构架构上的生物大数据并行计算研究[D]. 兰海东.山东大学 2018
[3]非线性协整时间序列的非参数方法及其应用研究[D]. 舒晓惠.暨南大学 2010

硕士论文
[1]基于卷积神经网络的单目图像深度估计研究[D]. 朱沛贤.南京邮电大学 2018
[2]基于异构处理器的深度卷积神经网络加速系统设计与实现[D]. 姜典坤.北京交通大学 2018



本文编号:3205116

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3205116.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户be625***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com