定制指令与协处理器加速机制的研究
发布时间:2023-03-27 20:33
随着微处理器性能的不断提升,嵌入式系统应用范围的不断扩大,日益增加的运算量和复杂度已经称为当前嵌入式设计的关键问题。在数字媒体、汽车电子、可移动电视以及智能手机等领域,复杂多变的应用需求使微处理器的运算能力面临着巨大的挑战。当前主要的加速机制包括多核处理器加速、专用集成电路(ASIC)加速、基于可配置处理器的定制指令加速、协处理器加速(如FPGA/DSP等)等。分析和研究各种加速机制的优缺点,为嵌入式系统加速机制的发展方向做一个有益的探索是本论文的写作目的。 本学位论文围绕定制指令加速和协处理器加速两种机制的实现和验证工作展开研究,重点研究了可配置处理器的设计方法学,定制指令和协处理器的设计方法,两种加速机制的设计实现和加速性能比较,以及以处理器为中心的SOC验证方法等。? 本论文的主要研究工作和创新点包括: (1)与项目组成员合作完成了“H.264视频解码芯片-VF1000”项目的设计和验证工作,负责可配置处理器的生成和定制指令的设计实现工作。基于多个可配置处理器核和硬件加速模块的SOC架构,实现了VGA分辨率30fps解码速度的视频编解码系统,成功地在多普达手机和惠普个人数字助理(...
【文章页数】:118 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 可配置处理器和定制指令概述
1.1.1 可配置处理器的研究现状
1.1.2 定制指令描述方法分类
1.1.3 定制指令加速的技术优势分析
1.2 协处理器相关研究
1.2.1 协处理器概述
1.2.2 协处理器加速的技术优势分析
1.3 功能验证的关键技术
1.4 本论文主要工作
1.5 本文结构安排
第2章 可配置处理器及定制指令设计技术
2.1 可配置处理器介绍
2.1.1 微处理器的发展
2.1.2 可配置处理器的特点
2.2 系统级的SOC 设计方法学
2.2.1 主要的设计方法
2.2.2 可配置处理器对设计方法学的新要求
2.3 可配置处理器架构
2.3.1 可配置处理器基本架构
2.3.2 ARC 处理器架构
2.4 处理器的配置和生成
2.5 定制指令的设计和实现
2.5.1 定制指令的生成算法
2.5.2 ARC 的定制指令设计流程
2.6 定制指令加速的应用
2.7 小结
第3章 定制指令加速视频编解码技术研究
3.1 H.264 变换和量化算法
3.1.1 H.264 概述
3.1.2 整数变换算法
3.1.3 量化算法
3.2 定制指令实现
3.2.1 变换算法实现
3.2.2 量化算法实现
3.2.3 优化方法
3.3 验证及分析
3.3.1 验证挑战
3.3.2 验证环境设计
3.3.3 验证流程
3.3.4 性能分析
3.4 小结
第4章 协处理器设计及实现研究
4.1 浮点协处理器组成
4.1.1 浮点协处理器概述
4.1.2 译码单元
4.1.3 发射单元
4.1.4 Load/Store 流水线
4.1.5 乘加流水线
4.1.6 除法开方流水线
4.1.7 协处理器接口
4.2 协处理器的系统建模
4.2.1 系统建模语言
4.2.2 协处理器系统模型设计
4.3 浮点协处理器结构实现
4.3.1 协处理器译码单元实现
4.3.2 协处理器发射单元实现
4.3.3 协处理器乘累加流水线实现
4.3.4 协处理器除法开方流水线实现
4.3.5 协处理器Load/Store 流水线实现
4.3.6 设计实现的优化技术
4.4 小结
第5章 协处理器的功能验证研究
5.1 验证平台设计
5.2 验证IP 设计
5.2.1 验证IP 概述
5.2.2 协处理器验证的VIP 设计
5.2.3 ARM VIP 实现
5.3 覆盖率驱动的验证方法
5.3.1 代码覆盖率
5.3.2 功能覆盖率
5.3.3 覆盖率驱动的验证方法
5.4 协处理器验证及实现
5.4.1 协处理器验证流程
5.4.2 软硬件协同验证
5.5 小结
第6章 结束语
参考文献
附录 H.264 测试码流详细属性
在读期间发表的学术论文与取得的研究成果
致谢
本文编号:3772806
【文章页数】:118 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 可配置处理器和定制指令概述
1.1.1 可配置处理器的研究现状
1.1.2 定制指令描述方法分类
1.1.3 定制指令加速的技术优势分析
1.2 协处理器相关研究
1.2.1 协处理器概述
1.2.2 协处理器加速的技术优势分析
1.3 功能验证的关键技术
1.4 本论文主要工作
1.5 本文结构安排
第2章 可配置处理器及定制指令设计技术
2.1 可配置处理器介绍
2.1.1 微处理器的发展
2.1.2 可配置处理器的特点
2.2 系统级的SOC 设计方法学
2.2.1 主要的设计方法
2.2.2 可配置处理器对设计方法学的新要求
2.3 可配置处理器架构
2.3.1 可配置处理器基本架构
2.3.2 ARC 处理器架构
2.4 处理器的配置和生成
2.5 定制指令的设计和实现
2.5.1 定制指令的生成算法
2.5.2 ARC 的定制指令设计流程
2.6 定制指令加速的应用
2.7 小结
第3章 定制指令加速视频编解码技术研究
3.1 H.264 变换和量化算法
3.1.1 H.264 概述
3.1.2 整数变换算法
3.1.3 量化算法
3.2 定制指令实现
3.2.1 变换算法实现
3.2.2 量化算法实现
3.2.3 优化方法
3.3 验证及分析
3.3.1 验证挑战
3.3.2 验证环境设计
3.3.3 验证流程
3.3.4 性能分析
3.4 小结
第4章 协处理器设计及实现研究
4.1 浮点协处理器组成
4.1.1 浮点协处理器概述
4.1.2 译码单元
4.1.3 发射单元
4.1.4 Load/Store 流水线
4.1.5 乘加流水线
4.1.6 除法开方流水线
4.1.7 协处理器接口
4.2 协处理器的系统建模
4.2.1 系统建模语言
4.2.2 协处理器系统模型设计
4.3 浮点协处理器结构实现
4.3.1 协处理器译码单元实现
4.3.2 协处理器发射单元实现
4.3.3 协处理器乘累加流水线实现
4.3.4 协处理器除法开方流水线实现
4.3.5 协处理器Load/Store 流水线实现
4.3.6 设计实现的优化技术
4.4 小结
第5章 协处理器的功能验证研究
5.1 验证平台设计
5.2 验证IP 设计
5.2.1 验证IP 概述
5.2.2 协处理器验证的VIP 设计
5.2.3 ARM VIP 实现
5.3 覆盖率驱动的验证方法
5.3.1 代码覆盖率
5.3.2 功能覆盖率
5.3.3 覆盖率驱动的验证方法
5.4 协处理器验证及实现
5.4.1 协处理器验证流程
5.4.2 软硬件协同验证
5.5 小结
第6章 结束语
参考文献
附录 H.264 测试码流详细属性
在读期间发表的学术论文与取得的研究成果
致谢
本文编号:3772806
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3772806.html