面向通讯同步的多处理器阵列重构
本文选题:VLSI阵列 + 拓扑重构 ; 参考:《计算机科学》2017年07期
【摘要】:从多处理器阵列中获取所需大小并且同步通讯性能优良的子阵列,是高性能拓扑重构的核心问题之一。基于不同的逻辑列剔除策略提出了3种面向通讯同步的拓扑重构算法:基于分治思想剔除逻辑列的重构算法(SCA_01),该算法能够使被优化的逻辑列相对均匀地分布在物理阵列中;优先剔除长逻辑列的贪心重构算法(SCA_02),该算法能够使被优化的逻辑列的长链接总数最少;基于分治与长链接数的混成重构算法(SCA_03),该算法将某一区域内的最长逻辑列剔除,且尽可能将剩余逻辑列均匀分布在物理阵列中。同时,对逻辑阵列的最大通讯延时给出了下界的求解算法。实验结果表明,3种算法在故障率小于1%、逻辑列的剔除率超过20%时,算法重构出的逻辑阵列的通讯延时特别接近计算出的性能下界。在多数情况下SCA_01优于SCA_02和SCA_03,而后两者的性能相近。在小阵列上且故障率与剔除率较小时,SCA_02具有性能优势,但在大阵列上SCA_03具有优势。在32×32的阵列上,SCA_01构造的阵列产生的通讯延时较SCA_02和SCA_03产生的延时平均减少25%,并且运行速度也提升了19.4%。
[Abstract]:It is one of the core problems of high performance topology reconstruction to obtain the required size from the multiprocessor array and to synchronize the sub-arrays with good communication performance. Three topology reconstruction algorithms oriented to communication synchronization are proposed based on different logic column elimination strategies: the algorithm of reconstructing logic columns based on partition and conquer is called SCAstack 01, which can make the optimized logic columns distribute in the physical array relatively evenly; The greedy reconstruction algorithm (SCA02C), which gives priority to the elimination of long logical columns, can minimize the total number of long links in the optimized logical columns, and the hybrid reconstruction algorithm based on partition, conquer and long link number (SCA03), which removes the longest logical columns in a certain region, As far as possible, the remaining logical columns are uniformly distributed in the physical array. At the same time, the lower bound algorithm is given for the maximum communication delay of logic array. The experimental results show that when the failure rate is less than 1 and the elimination rate of logic sequence is more than 20, the communication delay of the reconstructed logic array is especially close to the calculated lower bound of performance. In most cases, SCA_01 is superior to SCA_02 and SCA03, and the performance of the latter two is similar. On the small array, the failure rate and elimination rate are smaller than that on the small array, but the SCA_03 has the advantage on the large array. The communication delay generated by the array constructed by SCA01 on the 32 脳 32 array is 25% less than that produced by SCA_02 and SCA_03 on average, and the running speed is also increased by 19.4%.
【作者单位】: 广东工业大学计算机学院;
【基金】:国家自然科学基金项目(61572144) 广东省科技计划应用专项基金(2015B010129014) 广东省自然科学基金项目(2016A030313703)资助
【分类号】:TP332
【参考文献】
相关期刊论文 前2条
1 张元瑞;武继刚;段新明;;可重构阵列的同步性能优化算法[J];计算机科学;2012年03期
2 徐雄;沈宇泽;孙学梅;武继刚;;可重构处理器阵列的容错上界[J];武汉大学学报(理学版);2011年06期
【相似文献】
相关期刊论文 前10条
1 ;多处理器成为主流技术[J];今日电子;1995年03期
2 柴振荣;群集正在得到公认,多处理器走向成熟[J];管理科学文摘;1999年05期
3 CONI;;多处理器性能分析[J];电脑自做;2003年10期
4 安德思 ,李晶皎;软件交响曲——在多处理器中实时性与高实用性的融合[J];电子产品世界;2005年03期
5 郭松柳;汪东升;姚文斌;;片上多处理器的层次化高速测试和验证技术[J];哈尔滨工程大学学报;2007年05期
6 金海;;《多处理器编程的艺术》[J];计算机教育;2008年19期
7 邵森;;嵌入式测控系统中的多处理器架构设计[J];今日科苑;2009年04期
8 夏磊;岳焱;;基于多处理器虚拟化的云计算应用的安全研究[J];中国新通信;2013年11期
9 黄光奇,凌云翔,周兴铭;单芯片多处理器[J];电子计算机与外部设备;1998年06期
10 ;奔腾Ⅱ至强处理器与高能奔腾处理器比较[J];中国计算机用户;1998年28期
相关会议论文 前4条
1 刘磊;;基于便签式存储器的SoC多处理器访存结构设计与实现[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
2 李永进;周宏伟;邓让钰;张英;潘国腾;曾坤;;片上多处理器中目录控制器的死锁避免设计[A];第十六届计算机工程与工艺年会暨第二届微处理器技术论坛论文集[C];2012年
3 黄红;;几种建立计算机系统方案的比较[A];OA’97全国办公自动化学术与经验交流会论文集[C];1997年
4 李晓军;邓旭亮;;VXI总线频谱分析仪模块中的多处理器通信接口设计[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
相关重要报纸文章 前10条
1 姜波;Dell终于靠近AMD[N];网络世界;2006年
2 范荣;AMD推出适用于服务器的多处理器平台[N];通信产业报;2001年
3 ;多处理器服务器[N];网络世界;2001年
4 本报记者 谢文砚;中端计算 小型机面临x86挑战[N];网络世界;2005年
5 本报记者 武汉;AMD2007年 推出四核心皓龙[N];网络世界;2005年
6 ;SCO公布Linux许可条款[N];计算机世界;2003年
7 汪东升;集多处理器于一身的CMP[N];金融时报;2006年
8 吕森林;采用SMP物有所值吗[N];中国电脑教育报;2002年
9 ;超级计算机超越了什么?[N];网络世界;2005年
10 本报记者 赵霞;XteamServer 5.0更重应用支持[N];计算机世界;2004年
相关博士学位论文 前3条
1 顾雄礼;片上多处理器关键技术研究[D];浙江大学;2011年
2 李颀;基于FPGA的片上多处理器建模方法[D];中国科学技术大学;2012年
3 鲁建壮;单芯片多处理器关键技术的研究与实现[D];国防科学技术大学;2005年
相关硕士学位论文 前10条
1 闫建明;异构多处理器中温度感知实时任务调度机制研究与算法设计[D];华东师范大学;2015年
2 于金铭;多核平台上混合关键性任务实时调度算法研究[D];东北大学;2013年
3 宋伟;面向实时的星载多处理器操作系统的研究与实现[D];国防科学技术大学;2006年
4 尹伟;多处理器单调速率任务调度算法研究[D];东华大学;2012年
5 牛英香;嵌入式开源操作系统的多处理器功能扩展及应用[D];北京邮电大学;2013年
6 朱俊超;基于多处理器的双优化级调度算法改进与实现[D];大连理工大学;2010年
7 宋彭涛;系统级模拟器中多处理器间通信模拟技术研究[D];解放军信息工程大学;2010年
8 李松涛;并行多处理器系统容错的研究与实现[D];电子科技大学;2006年
9 由四海;多处理器的时钟同步技术的研究与实现[D];西安工业大学;2010年
10 王鲁光;多处理器片上系统中温度感知的任务调度算法研究[D];山东大学;2012年
,本文编号:1805735
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1805735.html