分块内存的数据分布优化
本文选题:分块内存 + 地址生成单元 ; 参考:《小型微型计算机系统》2015年04期
【摘要】:为了提高访存效率,提供可以与计算流水线并行执行的多个独立的访存流水线,魂芯DSP片上存储器设计时采用分块内存结构,并在核内提供多个独立的地址生成单元用于访存操作.针对分块内存的结构特点,编译器对程序中的存储访问构建关于变量的冲突图,对分块内存进行存储块分配,优化数据在分块内存的分布.以数据在分块内存的优化分布为基础,指导程序中访存操作在地址生成单元的优化分配,使得编译器生成的代码可以最大程度地挖掘程序中数据访问的并行性.实验表明,基于分块内存的数据分配分布优化为其它优化如地址寄存器的分簇、访存向量化、软件流水等经典优化提供了良好基础,保证了编译器生成的代码可以充分发挥魂芯DSP提供的指令级并行能力.
[Abstract]:In order to improve the efficiency of memory access, we provide several independent memory access pipeline, which can be executed in parallel with the computation pipeline. The memory on the DSP chip is designed with a block memory structure.A plurality of independent address generation units are provided in the core for memory access operations.In view of the structural characteristics of block memory, the compiler constructs a conflict graph about variables for memory access in a program, distributes block memory to block memory, and optimizes the distribution of data in block memory.Based on the optimal distribution of data in block memory, the optimal allocation of memory access operations in address generation units in the program can be used to maximize the parallelism of data access in the compiler generated code.The experimental results show that the data distribution optimization based on block memory provides a good basis for other optimization such as clustering of address registers, memory access vectorization, software income and so on.It ensures that the code generated by the compiler can give full play to the command-level parallelism provided by the Soul Core DSP.
【作者单位】: 合肥工业大学计算机与信息学院;中国电子科技集团公司第三十八研究所;中国科学技术大学计算机科学与技术学院;
【基金】:国家“核心电子器件、高端通用芯片及基础软件产品”重大专项(2012ZX01034001-001)资助
【分类号】:TP333
【参考文献】
相关期刊论文 前4条
1 雷一鸣;洪一;徐云;姜海涛;;一种基于寄存器压力的VLIW DSP分簇算法[J];计算机应用;2010年01期
2 李文龙,陈_g,林海波,汤志忠;3种提高软件流水有效性的算法:比较和结合[J];软件学报;2005年10期
3 魏帅;赵荣彩;姚远;;面向SLP的多重循环向量化[J];软件学报;2012年07期
4 郑启龙;卢世贤;洪兴勇;陈元;夏霏;;DSP分块内存和多AGU的编译指示优化[J];小型微型计算机系统;2012年03期
【共引文献】
相关期刊论文 前10条
1 郭元曦;桑恩方;王继胜;;MUSIC算法在分布式并行处理机上的实现研究[J];电子技术应用;2007年01期
2 李冬冬;吴玉斌;郝永平;王磊;;基于FPGA+DSP的USB高速数据采集系统设计与实现[J];成组技术与生产现代化;2014年01期
3 侯永生;赵荣彩;高伟;高伟;;非正规化循环的单指令多数据向量化[J];计算机应用;2013年11期
4 赵博;赵荣彩;李雁冰;高伟;;类型转换语句的SLP发掘方法[J];计算机科学;2014年11期
5 赵博;赵荣彩;徐金龙;高伟;;渐进式智能回溯向量化代码调优方法[J];计算机科学;2015年01期
6 丁陈飞;郑启龙;徐华叶;付和萍;陈元;;多簇超长指令字DSP复数运算的编译优化[J];计算机应用与软件;2015年02期
7 孙凤文;颛孙世周;陆海波;;某型火箭炮阵地计算与传输系统设计[J];火炮发射与控制学报;2015年01期
8 郑启龙;卢世贤;洪兴勇;陈元;夏霏;;DSP分块内存和多AGU的编译指示优化[J];小型微型计算机系统;2012年03期
9 林传文;顾乃杰;雷一鸣;洪一;;分簇VLIW DSP的SIMD编译优化[J];中国科学技术大学学报;2011年08期
10 冯玉谦;郑启龙;卢世贤;陈思灵;付和萍;;基于IMPACT的嵌入式汇编设计与实现[J];计算机系统应用;2012年09期
相关硕士学位论文 前10条
1 卢世贤;基于IMPACT的嵌入式汇编及编译指示的研究与实现[D];中国科学技术大学;2011年
2 龙成;基于DAVINCI平台的运动物体捕捉系统研究[D];西南交通大学;2013年
3 索维毅;面向DSP的自动向量化及优化技术研究[D];解放军信息工程大学;2013年
4 徐华叶;多簇VLIW DSP向量化相关编译技术研究[D];中国科学技术大学;2014年
5 廖伟;基于多核DSP的实时图像增强显示硬件系统实现[D];中国科学院研究生院(光电技术研究所);2014年
6 丁陈飞;VLIW体系的多簇DSP分簇算法的研究和复数运算的优化[D];中国科学技术大学;2014年
7 朱火龙;基于多核DSP的弹载SAR成像信号处理系统设计[D];西安电子科技大学;2014年
8 韩洁;基于FMC6416的时延估计研究与实现[D];燕山大学;2014年
9 王职军;细胞特征提取及聚类算法研究与DSP实现[D];湘潭大学;2014年
10 谢俊;基于TMS320C6678的细胞图像识别并行系统设计与实现[D];湘潭大学;2014年
【二级参考文献】
相关期刊论文 前1条
1 雷一鸣;洪一;徐云;姜海涛;;一种基于寄存器压力的VLIW DSP分簇算法[J];计算机应用;2010年01期
【相似文献】
相关期刊论文 前10条
1 刘晓娴;赵荣彩;丁锐;李雁冰;;基于循环分块的流水粒度优化算法[J];计算机应用;2013年08期
2 秦永胜,徐用懋,方崇智,唐杰;改进的多元精馏塔动态分块模型[J];化工自动化及仪表;1996年04期
3 徐冬冬;陈秀宏;;分块二维保局投影方法及其在人脸识别中的应用[J];计算机应用;2009年08期
4 徐德智;赖雅;王润梅;;大规模本体分块与映射研究[J];小型微型计算机系统;2012年03期
5 蔡德钧 ,王宏远;一种自适应分块截断编码[J];华中工学院学报;1985年04期
6 林向东;故障模拟中的诊断度和动态分块[J];计算机学报;1986年02期
7 李慧驰;;改进的随机分块模型[J];科技致富向导;2013年32期
8 宋江洪,赵忠明;图像分块分层结构在海量数据处理中的应用[J];计算机工程与应用;2004年33期
9 李慧;沈洁;张舒;顾天竺;吴颜;陈晓红;;基于页面分块与信息熵的评论发现及抽取[J];计算机应用研究;2007年02期
10 陈乾;徐德智;陈建二;;基于覆盖聚类的大本体分块映射研究[J];计算机工程与应用;2009年10期
相关会议论文 前10条
1 任安禄;邓见;;分块法求解圆球强迫对流场[A];第十一届全国水动力学学术会议暨第二十四届全国水动力学研讨会并周培源诞辰110周年纪念大会文集(上册)[C];2012年
2 陈宜稳;王威;王润生;;分块建模和点建模联合的背景重建方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 伍中平;;双向不等高正交钢管桁架分块整体提升施工技术[A];大型复杂钢结构建筑工程施工新技术与应用论文集[C];2012年
4 邹李;杜小勇;何军;;B3:图间节点相似度分块计算方法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
5 窦朝晖;;影响分块算法性能的主要因素[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 肖永浩;黄清南;;基于分块数据结构的冲击问题并行计算[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
7 戴妍峰;刘藻珍;;空间望远镜分块式主镜面形控制系统建模[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
8 李嘉伟;孙明;;基于分块LAB特征的粒子滤波目标跟踪算法[A];中国农业工程学会2011年学术年会论文集[C];2011年
9 ;大会主题报告[A];2009年全国微波毫米波会议论文集(下册)[C];2009年
10 许晓阳;赵晓飞;;新型城轨车辆限界分块轮廓板快速设计方法[A];第八届中国智能交通年会论文集[C];2013年
相关重要报纸文章 前6条
1 雷明;企业扭亏分块搞活应处理好的几个关系[N];中国企业报;2000年
2 雷明;分块搞活应处理好几个关系[N];中国航空报;2001年
3 覃匡龙 周鸿广 侯俊富;“分块管理”破解警力难题[N];检察日报;2003年
4 王书明;新华中学形成安全管理网络[N];商洛日报;2007年
5 记者 郭凤美;“分块搞活”救了太原制药[N];山西经济日报;2004年
6 段燕婷;大理市文明工程分块落地[N];云南经济日报;2013年
相关博士学位论文 前2条
1 邹健;分块稀疏表示的理论及算法研究[D];华南理工大学;2012年
2 何边;复杂网络上的分块问题[D];上海交通大学;2012年
相关硕士学位论文 前10条
1 闵慧;面向语义服务的大规模本体分块映射研究[D];中南大学;2013年
2 王润梅;基于Laplace矩阵的大规模本体分块映射的研究[D];中南大学;2011年
3 齐朗晔;基于分块核函数特征的交通标识识别[D];南京理工大学;2013年
4 杨冠军;基于混合聚类的大本体分块映射及评价方法研究[D];中南大学;2009年
5 孙维鹏;结构振动主动控制的分块方法[D];吉林大学;2004年
6 郭维;基于二部图模型的大本体分块与映射研究[D];中南大学;2012年
7 黄晓威;分块人脸奇偶对称性在人脸识别中的应用[D];广东工业大学;2013年
8 孙丽卿;基于分块压缩传感的图像重建算法研究[D];天津理工大学;2012年
9 黄敏;大数据下基于块依赖的实体解析方法[D];北京交通大学;2015年
10 王丹丹;面向移动设备的WEB页面分块算法研究[D];华中科技大学;2007年
,本文编号:1755352
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1755352.html