NVIDIA Tegra K1异构计算平台访存优化研究
本文关键词:NVIDIA Tegra K1异构计算平台访存优化研究
更多相关文章: GPU优化 访存带宽 数据本地化 向量化 合并访问 拉普拉斯滤波算法
【摘要】:在异构计算平台的移植和优化过程中,数字图像处理算法的访存性能已成为制约系统性能的主要因素。为此,结合NVIDIA Tegra K1硬件架构特征和具体算法特性,从合并与向量化访存优化、全局访存bank和channel冲突消除等方面,对矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上的实现和访存性能优化进行研究。实验结果表明,采用优化方法后的矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上取得了较大的访存性能提升,并且具有较好的实时性。
【作者单位】: 北京联合大学电子信息技术实验实训基地;北京联合大学自动化学院;北京联合大学应用科技学院;
【关键词】: GPU优化 访存带宽 数据本地化 向量化 合并访问 拉普拉斯滤波算法
【基金】:国家自然科学基金重大研究计划项目(91420202) 北京市教育委员会科技计划面上项目(SQKM201411417010,KM201511417003)
【分类号】:TP391.41
【正文快照】: 0概述由于受到功耗和硬件等方面的限制,因此单纯依靠提升芯片频率来提高处理器性能的方法已经变得越来越困难[1]。在这种情况下,多核和众核成为计算体系结构发展的趋势。随着可编程性的增强和处理器性能的提高,GPU受到越来越多开发人员的青睐。 各芯片厂商都推出了自己的GPU
【相似文献】
中国期刊全文数据库 前10条
1 HMC;;异构来临 HSA联盟初探[J];电脑迷;2013年07期
2 罗伟良;李观钊;陈虎;荣霓;;面向异构计算平台的列数据库调度方法研究与实现[J];计算机科学;2013年03期
3 曾国荪,263.net,陆鑫达;异构计算中的负载共享[J];软件学报;2000年04期
4 万剑怡,孙永强,薛锦云;一种异构计算系统中考虑通信冲突的有效任务调度算法[J];小型微型计算机系统;2002年02期
5 冯颖;袁庆华;沈健炜;;基于CPU+GPU异构计算的编程方法研究[J];通信技术;2011年02期
6 肖汉雄;陈次昌;齐冬梅;;一种异构计算环境下基于复制的调度算法[J];计算机工程;2006年03期
7 曾国荪,周定康,黄明和;异构计算开发最大循环并行性(英文)[J];江西师范大学学报(自然科学版);2000年04期
8 陆鑫达,郑飞;异构计算系统的表调度式任务映射与调度算法[J];上海交通大学学报;1998年10期
9 裴根;朱振国;孔颖;;一种针对异构计算平台的编译期优化方法[J];计算机应用研究;2013年05期
10 蔡荣英;;异构计算系统的独立任务调度启发式算法[J];福建电脑;2006年01期
中国重要会议论文全文数据库 前1条
1 陈虎;陈思桐;李观钊;罗伟良;甄真;张林亚;干芸芸;赖路双;奚建清;;异构计算平台上列存储数据库的并行查询技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
中国重要报纸全文数据库 前1条
1 本报记者 王星;异构计算引领软件开发创新[N];电脑报;2012年
中国博士学位论文全文数据库 前1条
1 张丹;面向异构体系结构的任务流化技术研究[D];解放军信息工程大学;2012年
中国硕士学位论文全文数据库 前3条
1 纪剑雄;基于异构计算系统中动态任务分配的蜂群算法研究[D];华东师范大学;2008年
2 张胜辉;基于FPGA加速的异构计算多结点系统实时硬件任务调度与管理[D];华东交通大学;2013年
3 周子航;基于OpenCL异构计算的数学图像绘制[D];广州大学;2013年
,本文编号:755991
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/755991.html