专用视频处理器指令集研究与数据通路设计
发布时间:2023-02-25 20:50
专用指令集处理器具备了专用集成电路的高效性与通用处理器的灵活性,在视频处理领域有着广阔的应用前景。本文围绕面向视频应用的专用指令集处理器,在指令集和体系结构方面进行了研究。 通过对典型视频应用的研究与分析,提取并归纳出视频处理中复杂度集中关键函数。通过对关键函数的深入研究,发现其中存在着并行性高,指令组合运算丰富,数据精度低等特性。在此基础上,设计了一套SIMD/VLIW混合结构的专用指令集。专用指令集结合SIMD和VLIW指令体系的特点,支持指令条件执行、计算结果饱和处理,内置数据组织等扩展指令功能,并针对视频处理中复杂度集中的运算核心,设计了专用的加速指令。典型视频运算核心的测试表明,与MMX,SSE2等通用处理器媒体扩展相比,采用SIMD/VLIW混合结构指令集能显著减少时钟数和非计算开销,实现高效的视频处理。 VLIW体系会造成代码长度膨胀,给嵌入式系统带来资源上的浪费。本文采用动态变长编码方法,采用添加取指控制码的形式,在编码时有效地消除了VLIW指令束中的空指令;采用双字和单字两种指令编码宽度,提高指令内部的编码效率。测试表明,对于典型的视频运算核心,动态变长编码的代码长度...
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景
1.1.1 视频编解码技术发展现状
1.1.2 专用指令集处理器(ASIP)
1.2 课题研究的意义
1.3 相关研究的现状
1.4 本文研究的内容和文章结构
1.4.1 研究的主要内容
1.4.2 论文的组织结构
第2章 视频标准的特性分析
2.1 视频压缩标准的定性分析
2.1.1 MPEG-2
2.1.2 H.263
2.1.3 MPEG-4
2.1.4 H.264
2.2 视频压缩标准的定量分析
2.2.1 Mediabench Ⅱ Video&Image基准测试集
2.2.2 视频典型应用的复杂度分析
2.2.2.1 测试工具
2.2.2.2 复杂度分析结果
2.2.2.3 对关键函数的分析
2.2.3 视频典型应用的指令和数据类型
2.3 本章小结
第3章 面向视频应用的指令集设计
3.1 加速视频处理的指令集设计策略
3.1.1 采用并行处理技术
3.1.1.1 采用SIMD技术实现数据级并行
3.1.1.2 采用VLIW技术实现指令级并行
3.1.2 扩展指令功能
3.1.2.1 计算结果饱和处理
3.1.2.2 指令条件执行
3.1.2.3 内置数据组织
3.1.3 设计专用指令
3.1.3.1 运动估计加速指令
3.1.3.2 DCT/IDCT变换加速指令
3.1.3.3 插值和滤波加速指令
3.2 面向视频应用的专用指令集
3.3 专用指令集性能评估
第4章 变长指令编码研究和汇编器设计
4.1 变长编码研究
4.1.1 VLIW技术的瓶颈
4.1.2 解决代码膨胀的方法
4.1.3 动态变长指令编码
4.1.4 动态变长编码性能分析
4.2 指令集汇编器设计
4.2.1 汇编器总体结构设计
4.2.2 汇编器具体实现
4.2.2.1 词法分析
4.2.2.2 语法分析
4.2.2.3 计算标签地址
4.2.2.4 产生目标代码
第5章 专用指令集视频处理器数据通路设计
5.1 专用指令集视频处理器SCHUBERT
5.1.1 Schubert概述
5.1.2 Schubert的流水线结构
5.2 处理器数据通路设计
5.2.1 Schubert数据通路的主要特点
5.2.2 数据通路的总体结构
5.2.3 数据通路功能单元设计
5.2.3.1 EX0级功能单元
5.2.3.2 EX1级功能单元
5.2.3.3 EX2级功能单元
5.2.3.4 EX3级功能单元
5.2.3.5 计算结果饱和处理
5.3 本章小结
第6章 总结和展望
6.1 结论
6.2 未来展望
参考文献
攻读硕士学位期间发表/录用的学术论文
致谢
本文编号:3749173
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景
1.1.1 视频编解码技术发展现状
1.1.2 专用指令集处理器(ASIP)
1.2 课题研究的意义
1.3 相关研究的现状
1.4 本文研究的内容和文章结构
1.4.1 研究的主要内容
1.4.2 论文的组织结构
第2章 视频标准的特性分析
2.1 视频压缩标准的定性分析
2.1.1 MPEG-2
2.1.2 H.263
2.1.3 MPEG-4
2.1.4 H.264
2.2 视频压缩标准的定量分析
2.2.1 Mediabench Ⅱ Video&Image基准测试集
2.2.2 视频典型应用的复杂度分析
2.2.2.1 测试工具
2.2.2.2 复杂度分析结果
2.2.2.3 对关键函数的分析
2.2.3 视频典型应用的指令和数据类型
2.3 本章小结
第3章 面向视频应用的指令集设计
3.1 加速视频处理的指令集设计策略
3.1.1 采用并行处理技术
3.1.1.1 采用SIMD技术实现数据级并行
3.1.1.2 采用VLIW技术实现指令级并行
3.1.2 扩展指令功能
3.1.2.1 计算结果饱和处理
3.1.2.2 指令条件执行
3.1.2.3 内置数据组织
3.1.3 设计专用指令
3.1.3.1 运动估计加速指令
3.1.3.2 DCT/IDCT变换加速指令
3.1.3.3 插值和滤波加速指令
3.2 面向视频应用的专用指令集
3.3 专用指令集性能评估
第4章 变长指令编码研究和汇编器设计
4.1 变长编码研究
4.1.1 VLIW技术的瓶颈
4.1.2 解决代码膨胀的方法
4.1.3 动态变长指令编码
4.1.4 动态变长编码性能分析
4.2 指令集汇编器设计
4.2.1 汇编器总体结构设计
4.2.2 汇编器具体实现
4.2.2.1 词法分析
4.2.2.2 语法分析
4.2.2.3 计算标签地址
4.2.2.4 产生目标代码
第5章 专用指令集视频处理器数据通路设计
5.1 专用指令集视频处理器SCHUBERT
5.1.1 Schubert概述
5.1.2 Schubert的流水线结构
5.2 处理器数据通路设计
5.2.1 Schubert数据通路的主要特点
5.2.2 数据通路的总体结构
5.2.3 数据通路功能单元设计
5.2.3.1 EX0级功能单元
5.2.3.2 EX1级功能单元
5.2.3.3 EX2级功能单元
5.2.3.4 EX3级功能单元
5.2.3.5 计算结果饱和处理
5.3 本章小结
第6章 总结和展望
6.1 结论
6.2 未来展望
参考文献
攻读硕士学位期间发表/录用的学术论文
致谢
本文编号:3749173
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3749173.html