当前位置:主页 > 科技论文 > 计算机论文 >

面向局部性和并行优化的循环分块技术

发布时间:2018-03-13 02:07

  本文选题:循环分块 切入点:最优分块大小 出处:《计算机研究与发展》2015年05期  论文类型:期刊论文


【摘要】:循环分块是一种广泛用于改善数据局部性和开发并行性的程序变换优化技术.主要分为2类:固定分块技术和参数化分块技术,系统地总结了这2类技术,并分析了其优缺点.由于分块大小的选择会严重影响分块代码的性能,因此介绍分析了选择最优分块大小的各种方法.此外,总结了循环分块在多级分块、并行性开发和不完美嵌套循环等方面应用的各项技术.通过对循环分块技术当前研究现状的分析,得出如下结论:1)循环分块技术中的计算复杂度和生成代码效率问题还未得到完全解决,如何利用循环边界有效地约束迭代空间并提高数据局部性还需要更深入的研究;2)最优分块大小的选择依然是一个开放式难题,研究清楚分级存储架构中每级分块对性能的影响具有重要的意义;3)从循环分块的应用角度,如何有效地构建面向任意嵌套循环集的自动分块代码生成系统,同时充分利用深度共享存储资源和多核架构实现分块代码的高并行度,也是一个需要深入研究的问题.
[Abstract]:Cyclic partitioning is a program transformation optimization technique widely used to improve data locality and develop parallelism. It is divided into two categories: fixed block technique and parameterized partitioning technique, and these two kinds of techniques are summarized systematically. The advantages and disadvantages of block size are also analyzed. Because the choice of block size will seriously affect the performance of block code, various methods of selecting optimal block size are introduced. Parallel development and imperfect nested loops, etc. Through the analysis of the current research status of circular block technology, The conclusion is as follows: 1) the computational complexity and code generation efficiency of the cyclic block technique have not been completely solved. How to use the cyclic boundary to effectively constrain the iterative space and improve the data locality still needs more in-depth research on the selection of the optimal block size, which is still an open problem. It is of great significance to study the effect of each level block on performance in hierarchical storage architecture. (3) from the perspective of the application of cyclic block, how to effectively construct an automatic block code generation system for arbitrary nested loop sets is proposed. At the same time making full use of deep shared storage resources and multi-core architecture to achieve high degree of parallelism of block code is also a problem that needs further study.
【作者单位】: 西安交通大学电子与信息工程学院;
【基金】:国家自然科学基金项目(91330117) 国家”八六三”高技术研究发展计划基金项目(2012AA01A306,2012AA010901)
【分类号】:TP332;TP311.1

【参考文献】

相关期刊论文 前1条

1 贾耀仓;武成岗;张兆庆;;指导cache静态划分的程序性能profiling优化技术[J];计算机研究与发展;2012年01期

【共引文献】

相关期刊论文 前10条

1 刘宏义;杨明;肖瑜;;基于可编程图形硬件的音频信号处理技术[J];电子科技;2013年10期

2 何明华;;计算机技术在图形图像处理中的应用研究[J];计算机光盘软件与应用;2014年09期

3 李璋;杜慧敏;王涌钢;;字符串匹配算法的实现:CPU vs.GPU vs.FPGA[J];电子科技;2014年12期

4 吴粉侠;李红;;基于边缘强度匹配的图像融合并行算法的研究[J];电子设计工程;2014年23期

5 巨涛;朱正东;董小社;;异构众核系统及其编程模型与性能优化技术研究综述[J];电子学报;2015年01期

6 刘仲;田希;陈磊;;支持原位计算的高效三角矩阵乘法向量化方法[J];国防科技大学学报;2014年06期

7 由志杰;谢传节;马益杭;龙舟;;一种异构多核架构快速查询多边形图层间空间关系的方法[J];地球信息科学学报;2015年05期

8 龚若皓;杨斌;;基于移动多核GPU的并行二维DCT变换实现方法[J];成都信息工程学院学报;2015年01期

9 王正华;陆平静;车永刚;;迭代编译优化技术综述[J];计算机工程与应用;2008年32期

10 陆平静;车永刚;束尧;王正华;;多面体表示技术及在程序性能优化中的应用[J];计算机工程与科学;2008年09期

相关博士学位论文 前10条

1 严明;面向领域应用的异构多核SoC系统结构设计与优化[D];国防科学技术大学;2011年

2 车永刚;科学计算程序性能分析与优化关键技术研究[D];国防科学技术大学;2004年

3 陈莉;SMP机群上的并行代码优化技术[D];中国科学院研究生院(计算技术研究所);2002年

4 杜静;流体系结构的编译技术研究[D];国防科学技术大学;2008年

5 陆平静;低开销的迭代编译优化关键技术研究[D];国防科学技术大学;2010年

6 姚远;SIMD自动向量识别及代码调优技术研究[D];解放军信息工程大学;2012年

7 王庆;面向嵌入式多核系统的并行程序优化技术研究[D];哈尔滨工业大学;2013年

8 张志敏;化学计量学算法实现的软件开发基础研究[D];中南大学;2012年

9 甘新标;面向众核GPU的编程模型及编译优化关键技术研究[D];国防科学技术大学;2012年

10 刘勇;基于GPU的内存数据库索引技术研究[D];华南理工大学;2013年

相关硕士学位论文 前10条

1 余小喜;面向嵌入式系统的迭代式循环展开优化[D];国防科学技术大学;2011年

2 张媛媛;自动向量化中的收益评估技术研究[D];解放军信息工程大学;2011年

3 单莹;科学计算程序的综合优化技术研究[D];国防科学技术大学;2005年

4 陆平静;结合经验搜索和分析模型的代码优化方法研究[D];国防科学技术大学;2006年

5 冯权友;面向循环级数组访问的数据预取技术研究[D];国防科学技术大学;2008年

6 赵捷;面向分布存储的并行编译优化技术研究[D];解放军信息工程大学;2012年

7 刘荷苇;基于CUDA编程的神经网络手写数字识别[D];西南交通大学;2013年

8 凡保磊;卷积神经网络的并行化研究[D];郑州大学;2013年

9 李安平;基于CUDA的并行图像处理问题研究[D];西安电子科技大学;2013年

10 高伟;面向SIMD的自动向量化优化技术研究[D];解放军信息工程大学;2013年

【二级参考文献】

相关期刊论文 前1条

1 隋秀峰;吴俊敏;陈国良;;ARP:同时多线程处理器中共享Cache自适应运行时划分机制[J];计算机研究与发展;2008年07期

【相似文献】

相关期刊论文 前10条

1 刘晓娴;赵荣彩;丁锐;李雁冰;;基于循环分块的流水粒度优化算法[J];计算机应用;2013年08期

2 秦永胜,徐用懋,方崇智,唐杰;改进的多元精馏塔动态分块模型[J];化工自动化及仪表;1996年04期

3 徐冬冬;陈秀宏;;分块二维保局投影方法及其在人脸识别中的应用[J];计算机应用;2009年08期

4 徐德智;赖雅;王润梅;;大规模本体分块与映射研究[J];小型微型计算机系统;2012年03期

5 蔡德钧 ,王宏远;一种自适应分块截断编码[J];华中工学院学报;1985年04期

6 林向东;故障模拟中的诊断度和动态分块[J];计算机学报;1986年02期

7 李慧驰;;改进的随机分块模型[J];科技致富向导;2013年32期

8 宋江洪,赵忠明;图像分块分层结构在海量数据处理中的应用[J];计算机工程与应用;2004年33期

9 李慧;沈洁;张舒;顾天竺;吴颜;陈晓红;;基于页面分块与信息熵的评论发现及抽取[J];计算机应用研究;2007年02期

10 陈乾;徐德智;陈建二;;基于覆盖聚类的大本体分块映射研究[J];计算机工程与应用;2009年10期

相关会议论文 前10条

1 任安禄;邓见;;分块法求解圆球强迫对流场[A];第十一届全国水动力学学术会议暨第二十四届全国水动力学研讨会并周培源诞辰110周年纪念大会文集(上册)[C];2012年

2 陈宜稳;王威;王润生;;分块建模和点建模联合的背景重建方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 伍中平;;双向不等高正交钢管桁架分块整体提升施工技术[A];大型复杂钢结构建筑工程施工新技术与应用论文集[C];2012年

4 邹李;杜小勇;何军;;B3:图间节点相似度分块计算方法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

5 窦朝晖;;影响分块算法性能的主要因素[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

6 肖永浩;黄清南;;基于分块数据结构的冲击问题并行计算[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年

7 戴妍峰;刘藻珍;;空间望远镜分块式主镜面形控制系统建模[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

8 李嘉伟;孙明;;基于分块LAB特征的粒子滤波目标跟踪算法[A];中国农业工程学会2011年学术年会论文集[C];2011年

9 ;大会主题报告[A];2009年全国微波毫米波会议论文集(下册)[C];2009年

10 许晓阳;赵晓飞;;新型城轨车辆限界分块轮廓板快速设计方法[A];第八届中国智能交通年会论文集[C];2013年

相关重要报纸文章 前6条

1 雷明;企业扭亏分块搞活应处理好的几个关系[N];中国企业报;2000年

2 雷明;分块搞活应处理好几个关系[N];中国航空报;2001年

3 覃匡龙 周鸿广 侯俊富;“分块管理”破解警力难题[N];检察日报;2003年

4 王书明;新华中学形成安全管理网络[N];商洛日报;2007年

5 记者 郭凤美;“分块搞活”救了太原制药[N];山西经济日报;2004年

6 段燕婷;大理市文明工程分块落地[N];云南经济日报;2013年

相关博士学位论文 前2条

1 邹健;分块稀疏表示的理论及算法研究[D];华南理工大学;2012年

2 何边;复杂网络上的分块问题[D];上海交通大学;2012年

相关硕士学位论文 前10条

1 闵慧;面向语义服务的大规模本体分块映射研究[D];中南大学;2013年

2 王润梅;基于Laplace矩阵的大规模本体分块映射的研究[D];中南大学;2011年

3 齐朗晔;基于分块核函数特征的交通标识识别[D];南京理工大学;2013年

4 苏撔撔;基于分块模型和在线学习的目标跟踪[D];上海交通大学;2014年

5 杨冠军;基于混合聚类的大本体分块映射及评价方法研究[D];中南大学;2009年

6 孙维鹏;结构振动主动控制的分块方法[D];吉林大学;2004年

7 郭维;基于二部图模型的大本体分块与映射研究[D];中南大学;2012年

8 黄晓威;分块人脸奇偶对称性在人脸识别中的应用[D];广东工业大学;2013年

9 孙丽卿;基于分块压缩传感的图像重建算法研究[D];天津理工大学;2012年

10 黄敏;大数据下基于块依赖的实体解析方法[D];北京交通大学;2015年



本文编号:1604318

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1604318.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bda28***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com