数据驱动可重构阵列处理器体系结构研究
发布时间:2021-05-16 17:19
传统的处理器架构虽然具有较高的灵活性,但是难以满足多样性应用日益提高的效能需求。专用集成电路具有较快的执行速度和较低的功耗,但是缺乏足够的灵活性,无法满足层出不穷、不断演进的新型应用需求。可重构结构结合了生产标准化与应用定制化、计算高效性与编程灵活性的特点,是未来体系结构的发展方向。后摩尔时代工艺的线延迟已经远远超过门延迟,成为限制芯片工作频率进一步提高的主要瓶颈。避免长连线及降低系统功耗,计算机体系结构呈现出局部化、规则化、简单化的发展趋势。处理器设计也经历了从不断复杂化单核到简单化众核的发展过程。通过二维邻接短线将众多简单的处理核以阵列的形式互连,构成的可重构阵列处理器恰恰符合了体系结构的发展趋势。因此,研究数据驱动可重构阵列处理器具有重要意义。为了提高可重构计算结构性能,本文深入研究了数据驱动动态可重构阵列结构、数据驱动可重构阵列处理器、统一编址下的分布式共享存储结构及动态自重构机制,目的在于最大化任务的并行性、提高数据驱动动态可重构阵列的灵活性、缓解日益严重的“存储墙”问题以及降低算法切换时间、提高计算资源利用。本文主要研究内容如下:(1)为了最大化任务的并行性,从而提高可重构...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:145 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 课题来源和研究背景及意义
1.2 可重构结构的研究现状和发展趋势
1.2.1 可重构体系结构的研究现状和发展趋势
1.2.2 重构方法与机制的研究现状和发展趋势
1.2.3 可重构芯片片上互连结构研究现状与发展趋势
1.2.4 提高可重构计算结构性能的途径
1.3 可重构结构中的存储结构
1.3.1 可重构结构存储结构研究现状与趋势
1.3.2 可重构存储结构研究中存在的问题
1.4 论文的研究内容
1.5 论文的组织结构
第二章 数据驱动动态可重构阵列结构研究
2.1 数据驱动可重构阵列结构研究
2.1.1 数据驱动动态可重构阵列结构
2.1.2 数据通信网络结构研究
2.2 基于缓存的动态可重构阵列结构研究
2.3 动态自重构阵列结构研究
2.3.1 动态自重构阵列结构
2.3.2 配置下发网络结构研究
2.4 仿真与性能分析
2.4.1 数据驱动可重构阵列结构仿真与性能分析
2.4.2 基于缓存的动态可重构阵列结构仿真与性能分析
2.4.3 动态自重构阵列结构仿真与性能分析
2.4.4 三种结构对比分析
2.5 本章小结
第三章 数据驱动可重构轻核阵列处理器研究
3.1 可重构轻核阵列处理器结构研究
3.2 可重构轻核阵列处理器指令集设计
3.3 可重构轻核阵列处理器关键部件开发
3.3.1 轻核处理元
3.3.2 超越函数加速器
3.4 数据驱动邻接互连接口研究
3.4.1 共享寄存器接口互连结构
3.4.2 数据驱动接口互连结构
3.5 调整截距的分段线性逼近算法研究
3.5.1 正余弦函数逼近过程
3.5.2 对数/指数逼近过程
3.6 算法并行化映射及仿真验证
3.6.1 图像处理算法的映射
3.6.2 Alex Net卷积神经网络的映射
3.6.3 仿真验证与结果分析
3.7 性能分析
3.7.1 超越函数加速器误差分析
3.7.2 数据驱动可重构轻核阵列处理器综合结果及性能分析
3.8 本章小结
第四章 可重构轻核阵列处理器分布式共享存储结构研究
4.1 分布式共享存储结构研究
4.2 分布式共享存储关键部件开发
4.2.1 高速交换单元
4.2.2 虚通道路由器
4.3 高速交换单元结构研究
4.3.1 全交换结构
4.3.2 局部优先交换结构
4.3.3 行列两级交换结构
4.4 数据通信机制研究
4.5 视频处理算法映射
4.5.2 DCT、FFT、SAD算法映射
4.5.3 整数运动估计、分数运动估计、去块滤波算法映射
4.6 仿真与性能分析
4.6.2 应用映射仿真结果分析
4.6.3 三种高速交换结构仿真与性能分析
4.6.4 分布式共享存储结构仿真与性能分析
4.7 本章小结
第五章 数据驱动动态可重构阵列自重构机制
5.1“软件编程”重构方法研究
5.2 动态自重构机制研究
5.2.1 基本重构架构
5.2.2 固定配置重构方法和软件编程重构方法
5.2.3 数据驱动和配置驱动双重驱动的自重构方法
5.3 性能提升分析
5.4 计算密集型算法映射
5.4.1 离散余弦反变换
5.4.2 运动补偿
5.4.3 快速傅里叶变换
5.5 仿真与性能分析
5.5.1 仿真结果
5.5.2 性能分析
5.6 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
作者简介
【参考文献】:
期刊论文
[1]软件无线电中数字下变频技术研究[J]. 张红福. 中国新通信. 2017(07)
[2]从人工智能到神经网络处理器[J]. 陈云霁. 领导科学论坛. 2017(02)
[3]高性能多核处理器申威1600[J]. 胡向东,杨剑新,朱英. 中国科学:信息科学. 2015(04)
[4]基于同构多核处理器的任务调度[J]. 许雍祯,陈香兰,李曦,周学海. 计算机系统应用. 2014(11)
[5]Row-based configuration mechanism for a 2-D processing element array in coarse-grained reconfigurable architecture[J]. LIU LeiBo,WANG YanSheng,YIN ShouYi,ZHU Min,WANG Xing,WEI ShaoJun. Science China(Information Sciences). 2014(10)
[6]基于自路由互连网络的粗粒度可重构阵列结构[J]. 陈锐,杨海钢,王飞,贾瑞,王新刚. 电子与信息学报. 2014(09)
[7]计算模式的统一研究[J]. 沈绪榜,孙璐. 计算机学报. 2014(07)
[8]后摩尔时代集成电路的新器件技术[J]. 黄如,黎明,安霞,王润声,蔡一茂. 中国科学:信息科学. 2012(12)
[9]可重构计算处理器技术[J]. 魏少军,刘雷波,尹首一. 中国科学:信息科学. 2012(12)
[10]片上多处理器末级Cache优化技术研究[J]. 李浩,谢伦国. 计算机研究与发展. 2012(S1)
本文编号:3190093
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:145 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 课题来源和研究背景及意义
1.2 可重构结构的研究现状和发展趋势
1.2.1 可重构体系结构的研究现状和发展趋势
1.2.2 重构方法与机制的研究现状和发展趋势
1.2.3 可重构芯片片上互连结构研究现状与发展趋势
1.2.4 提高可重构计算结构性能的途径
1.3 可重构结构中的存储结构
1.3.1 可重构结构存储结构研究现状与趋势
1.3.2 可重构存储结构研究中存在的问题
1.4 论文的研究内容
1.5 论文的组织结构
第二章 数据驱动动态可重构阵列结构研究
2.1 数据驱动可重构阵列结构研究
2.1.1 数据驱动动态可重构阵列结构
2.1.2 数据通信网络结构研究
2.2 基于缓存的动态可重构阵列结构研究
2.3 动态自重构阵列结构研究
2.3.1 动态自重构阵列结构
2.3.2 配置下发网络结构研究
2.4 仿真与性能分析
2.4.1 数据驱动可重构阵列结构仿真与性能分析
2.4.2 基于缓存的动态可重构阵列结构仿真与性能分析
2.4.3 动态自重构阵列结构仿真与性能分析
2.4.4 三种结构对比分析
2.5 本章小结
第三章 数据驱动可重构轻核阵列处理器研究
3.1 可重构轻核阵列处理器结构研究
3.2 可重构轻核阵列处理器指令集设计
3.3 可重构轻核阵列处理器关键部件开发
3.3.1 轻核处理元
3.3.2 超越函数加速器
3.4 数据驱动邻接互连接口研究
3.4.1 共享寄存器接口互连结构
3.4.2 数据驱动接口互连结构
3.5 调整截距的分段线性逼近算法研究
3.5.1 正余弦函数逼近过程
3.5.2 对数/指数逼近过程
3.6 算法并行化映射及仿真验证
3.6.1 图像处理算法的映射
3.6.2 Alex Net卷积神经网络的映射
3.6.3 仿真验证与结果分析
3.7 性能分析
3.7.1 超越函数加速器误差分析
3.7.2 数据驱动可重构轻核阵列处理器综合结果及性能分析
3.8 本章小结
第四章 可重构轻核阵列处理器分布式共享存储结构研究
4.1 分布式共享存储结构研究
4.2 分布式共享存储关键部件开发
4.2.1 高速交换单元
4.2.2 虚通道路由器
4.3 高速交换单元结构研究
4.3.1 全交换结构
4.3.2 局部优先交换结构
4.3.3 行列两级交换结构
4.4 数据通信机制研究
4.5 视频处理算法映射
4.5.2 DCT、FFT、SAD算法映射
4.5.3 整数运动估计、分数运动估计、去块滤波算法映射
4.6 仿真与性能分析
4.6.2 应用映射仿真结果分析
4.6.3 三种高速交换结构仿真与性能分析
4.6.4 分布式共享存储结构仿真与性能分析
4.7 本章小结
第五章 数据驱动动态可重构阵列自重构机制
5.1“软件编程”重构方法研究
5.2 动态自重构机制研究
5.2.1 基本重构架构
5.2.2 固定配置重构方法和软件编程重构方法
5.2.3 数据驱动和配置驱动双重驱动的自重构方法
5.3 性能提升分析
5.4 计算密集型算法映射
5.4.1 离散余弦反变换
5.4.2 运动补偿
5.4.3 快速傅里叶变换
5.5 仿真与性能分析
5.5.1 仿真结果
5.5.2 性能分析
5.6 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
作者简介
【参考文献】:
期刊论文
[1]软件无线电中数字下变频技术研究[J]. 张红福. 中国新通信. 2017(07)
[2]从人工智能到神经网络处理器[J]. 陈云霁. 领导科学论坛. 2017(02)
[3]高性能多核处理器申威1600[J]. 胡向东,杨剑新,朱英. 中国科学:信息科学. 2015(04)
[4]基于同构多核处理器的任务调度[J]. 许雍祯,陈香兰,李曦,周学海. 计算机系统应用. 2014(11)
[5]Row-based configuration mechanism for a 2-D processing element array in coarse-grained reconfigurable architecture[J]. LIU LeiBo,WANG YanSheng,YIN ShouYi,ZHU Min,WANG Xing,WEI ShaoJun. Science China(Information Sciences). 2014(10)
[6]基于自路由互连网络的粗粒度可重构阵列结构[J]. 陈锐,杨海钢,王飞,贾瑞,王新刚. 电子与信息学报. 2014(09)
[7]计算模式的统一研究[J]. 沈绪榜,孙璐. 计算机学报. 2014(07)
[8]后摩尔时代集成电路的新器件技术[J]. 黄如,黎明,安霞,王润声,蔡一茂. 中国科学:信息科学. 2012(12)
[9]可重构计算处理器技术[J]. 魏少军,刘雷波,尹首一. 中国科学:信息科学. 2012(12)
[10]片上多处理器末级Cache优化技术研究[J]. 李浩,谢伦国. 计算机研究与发展. 2012(S1)
本文编号:3190093
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3190093.html