以编译为导向的Matrix-DSP程序分析与优化
发布时间:2023-04-12 02:30
数字信号处理器(DSP)在图像处理、自动化控制、信号处理等多个领域具有广泛应用。自主研发的Matrix DSP采用了典型的单指令多数据SIMD+超长指令字VLIW的向量化架构,因此面向该架构如何实现高效的向量化编程与优化是一项重要挑战。基于Matrix DSP的体系结构特点,以编译器性能为导向,对内核级代码常用的分析优化手段进行梳理和总结,并结合一个通用矩阵乘的例子进行展示,其执行性能可最高提升1个数量级。最后,从编译器优化和程序员高效编程的角度提出了一些后续的思考与讨论。
【文章页数】:10 页
【文章目录】:
1 引言
2 Matrix DSP结构特点及向量化编程
3 以编译为导向的程序分析与优化
3.1 通用矩阵乘算法并行性分析和基本算法映射
3.2 代码重构
3.3 计算访存解耦合
3.4 合并访存与寄存器优化
3.5 计算强度削弱:除乘法转换
3.6 手动软件流水优化
3.7 优化手段总结与评测
4 思考与讨论
5 结束语
本文编号:3790245
【文章页数】:10 页
【文章目录】:
1 引言
2 Matrix DSP结构特点及向量化编程
3 以编译为导向的程序分析与优化
3.1 通用矩阵乘算法并行性分析和基本算法映射
3.2 代码重构
3.3 计算访存解耦合
3.4 合并访存与寄存器优化
3.5 计算强度削弱:除乘法转换
3.6 手动软件流水优化
3.7 优化手段总结与评测
4 思考与讨论
5 结束语
本文编号:3790245
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3790245.html