SCC上FFT的高效并行实现及其扩展性研究
本文选题:FFT 切入点:SCC 出处:《小型微型计算机系统》2014年06期 论文类型:期刊论文
【摘要】:针对SCC(Single-Chip Cloud Computer,单芯片云计算机)体系结构,通过通信路由的改进、消息传递的预处理以及数据处理的再划分这三种手段来提升FFT并行实现效率并以此来研究SCC的扩展性.实验结果表明,SCC上改进后的FFT在一定规模内,双核下的平均加速比为4.10倍,最高可达4.78倍;四核下平均加速比为6.01倍,最高可达6.77倍;八核下平均加速比为10.46倍,最高可达11.53倍;十六核下平均加速比为16.20倍,最高可达18.51倍;三十二核下平均加速比为21.17倍,最高可达到24.20倍.并且随着规模的增加,核间通信带宽趋于稳定,三十二核的加速比也逐渐增大,结果显示SCC具有良好的可扩展性.
[Abstract]:Aiming at the SCC(Single-Chip Cloud computer (single chip cloud computer) architecture, the communication route is improved. The preprocessing of message passing and the subdivision of data processing are three methods to improve the efficiency of parallel implementation of FFT and to study the expansibility of SCC. The experimental results show that the improved FFT is within a certain scale. The average speedup under binucleus is 4.10 times, the highest is 4.78 times, the average acceleration ratio under four nuclei is 6.01 times, the maximum is 6.77 times, the average acceleration ratio under eight nuclei is 10.46 times, the maximum is 11.53 times, and the average acceleration ratio under 16 nuclei is 16.20 times. The average speedup of 32 cores is 21.17 times, and the highest is 24.20 times. With the increase of scale, the bandwidth of inter-core communication tends to stabilize, and the acceleration ratio of 32 cores increases gradually. The results show that SCC has good scalability.
【作者单位】: 中国科学技术大学计算机学院;安徽省计算与通信软件重点实验室;
【基金】:国家“核高基”重大专项(2009ZX01028-002-003-005)资助 国家自然科学基金项目(60833004)资助
【分类号】:TP303
【参考文献】
相关期刊论文 前3条
1 王刚强;钟诚;柯琦;;多核计算机上的快速傅里叶变换并行算法[J];计算机工程;2011年16期
2 郭利财;刘燕君;;龙芯3A处理器上FFT的高效实现[J];小型微型计算机系统;2012年03期
3 顾乃杰,陈静,潘伟;基于分组光纤被动星型网的FFT算法及其选路[J];中国科学技术大学学报;2002年05期
【共引文献】
相关期刊论文 前10条
1 李豹;;并行神经元集成在风险评估中的应用[J];安徽工程科技学院学报(自然科学版);2009年04期
2 刘瑜;廖同庆;;现代计算环境下的电磁模拟教学浅议[J];安庆师范学院学报(自然科学版);2011年03期
3 王慧亮;包尚联;陈国耀;;基于多核的并行模拟退火放疗计划优化加速方法[J];北京大学学报(自然科学版)网络版(预印本);2008年01期
4 王慧亮;包尚联;陈国耀;;基于多核的并行模拟退火放疗计划优化加速方法[J];北京大学学报(自然科学版);2008年06期
5 张旭;邱志平;胡举喜;;不确定结构区间特征值上下界的并行解法[J];北京航空航天大学学报;2007年09期
6 王维;赵慧洁;董超;;基于投影寻踪的高光谱图像异常检测并行算法[J];北京航空航天大学学报;2009年03期
7 殷文;;基于频率域高阶有限差分法的正演模拟及并行算法[J];吉林大学学报(地球科学版);2008年01期
8 向令;王鹏;;并行迭代算法的研究及应用[J];成都信息工程学院学报;2007年S1期
9 翟永;陈杰;刘磊;;基于集群技术的“天地图”运行支持环境设计[J];地理信息世界;2011年04期
10 张沙清;赵洁;;基于MPICH的多核并行程序设计[J];四川兵工学报;2011年01期
相关会议论文 前10条
1 陈连荣;彭朝晖;;高斯射线声场模型在MPI环境下的并行算法设计[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
2 侯有政;张方;;基于CUDA的动载荷频域识别的并行算法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
3 费广磊;马天宝;宁建国;郝莉;;基于MPI的三维爆炸与冲击问题的动态并行研究[A];第十二届现代数学和力学会议论文集[C];2010年
4 薛笑荣;赵荣椿;张艳宁;曾琪明;;一种并行的SAR图像边缘检测方法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
5 石虎;熊健民;宋庭新;;全主元高斯消去法在有限元并行计算中的应用[A];湖北省机械工程学会设计与传动学会、武汉机械设计与传动学会2008年学术年会论文集(2)[C];2008年
6 范培勤;笪良龙;过武宏;;WKBZ简正波方法的并行实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
7 张林;笪良龙;卢晓亭;;采用DSP的射线简正波理论并行算法设计[A];2008年全国声学学术会议论文集[C];2008年
8 王丹阳;田卫东;胡学钢;;基于SMP系统的并行Apriori算法研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
9 武艳强;江在森;杨国华;;最小二乘配置方法在提取GPS时间序列信息中的应用[A];GPS技术应用研究论文专辑[C];2007年
10 范培勤;笪良龙;陈冬滨;;WKBZ简正波方法在PC机群上的实现[A];2005年全国水声学学术会议论文集[C];2005年
相关博士学位论文 前10条
1 张琦;多核系统中的程序性能优化研究[D];中国科学技术大学;2010年
2 廖臣;三维电磁粒子模拟并行算法及其应用研究[D];电子科技大学;2010年
3 陈海勇;网格作业调度关键技术研究[D];解放军信息工程大学;2009年
4 黄永忠;移动代理计算模型及其在分布并行计算中的应用研究[D];解放军信息工程大学;2007年
5 张帆;基于MPI和GPU直流电法和大地电磁法三维正演的并行算法研究[D];中国地质大学(北京);2011年
6 程汤培;地下水流动数值模拟的高效并行计算研究[D];中国地质大学(北京);2011年
7 杨迪;原子及小分子强激光场动力学理论研究[D];大连理工大学;2011年
8 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年
9 吴超;信息检索中top-k问题的并行算法及优化研究[D];中国科学技术大学;2011年
10 方维;面向数据通信优化的并行程序执行模型[D];中国科学技术大学;2011年
相关硕士学位论文 前10条
1 吕信;激光能量沉积光路追踪法及其并行化[D];中国工程物理研究院;2009年
2 王东阳;多智能体调度优化算法研究[D];哈尔滨工程大学;2010年
3 张作阳;基于鲁棒性分析推断三羟基丙醛对两种酶的抑制作用[D];大连理工大学;2010年
4 苏涛;甘油生物歧化生产1,,3-丙二醇的混杂非线性动力系统辨识[D];大连理工大学;2010年
5 申俊华;中期火电开机优化的多核并行算法及其应用[D];大连理工大学;2010年
6 郜晓亚;水电站(群)长期优化调度多核并行算法与应用[D];大连理工大学;2010年
7 顾慧;基于异构平台的并行计算性能可视化研究[D];辽宁师范大学;2010年
8 裴保梅;基于物理特征的二维流场的并行拓扑结构分析[D];中国海洋大学;2010年
9 刘新国;基于多核处理器的并行图像融合处理技术的研究[D];沈阳理工大学;2010年
10 丁朋;凸优化在大规模机器学习中的应用[D];华东理工大学;2011年
【二级参考文献】
相关期刊论文 前5条
1 邓珊珊;孙义;章立生;莫志锋;谢应科;;q×2~m的高速FFT处理器设计[J];计算机研究与发展;2008年08期
2 李成军;周卫峰;朱重光;;基于Intel SIMD指令的二维FFT优化算法[J];计算机工程与应用;2007年05期
3 肖江;胡柯良;邓元勇;;基于CUDA的矩阵乘法和FFT性能测试[J];计算机工程;2009年10期
4 李俊山,叶霞,李建军,李新社,沈绪榜;基于LS MPP的图像并行傅立叶分析技术(1)——算法的原理、分析与设计[J];小型微型计算机系统;2004年07期
5 顾乃杰,陈静,潘伟;基于分组光纤被动星型网的FFT算法及其选路[J];中国科学技术大学学报;2002年05期
【相似文献】
相关期刊论文 前10条
1 刘俊;刘志祥;;应用Amdahl定律对多核处理器性能的分析[J];信息技术;2010年06期
2 胡灏;陈勇;;一种基于多线程技术的并行FFT算法[J];天津工业大学学报;2007年01期
3 庞文强;伍建林;;CFD并行计算平台的搭建与性能分析[J];重庆科技学院学报(自然科学版);2009年06期
4 边栋;曾鸣;曾凡太;;应用Hill-Marty推论对异构多核处理器设计的分析[J];山东大学学报(理学版);2011年05期
5 白军元,贺占庄;高速通用DSP的并行技术[J];微电子学与计算机;2003年04期
6 张军华;雷凌;吕宁;陆文志;;PowerEdge 1750微机集群并行性能测试及实例分析[J];石油工业计算机应用;2007年02期
7 程豪;张云泉;张先轶;李玉成;;CPU-GPU并行矩阵乘法的实现与性能分析[J];计算机工程;2010年13期
8 程海英;PDD算法在对称多处理器高性能计算机上的并行实现[J];重庆工商大学学报(自然科学版);2003年01期
9 张军华,章多荣,雷凌,吕宁,陆文志;PowerEdge 1750微机集群并行性能测试及实例分析[J];石油仪器;2005年03期
10 杨盛光;李丽;徐懿;张宇昂;张冰;;基于总线共享架构的片上多处理器系统性能探索[J];微电子学与计算机;2007年12期
相关会议论文 前10条
1 贾美丽;弓建军;孙承意;;PMEC在集群计算机上的实现[A];2003年中国智能自动化会议论文集(下册)[C];2003年
2 廖振民;袁仙春;;MFIC程序在YH-2机上的并行计算[A];中国工程物理研究院科技年报(1998)[C];1998年
3 赖生建;王秉中;;共享内存系统中不交换数据的并行FDTD计算[A];2009年全国天线年会论文集(上)[C];2009年
4 徐俊英;彭绍鑫;聂在平;;基于GPU的并行MLFMA[A];2009年全国天线年会论文集(上)[C];2009年
5 周昆;潘益农;王东勇;朱红芳;;中尺度数值模式在IBMP690上的并行测试[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
6 所光;杨学军;;双核处理器性能最优的共享Cache划分[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
7 肖文名;陈晓宇;石小英;宋远清;何婉文;吴俏梅;;并行计算机系统建设探讨[A];信息技术在气象领域的开发应用论文集(二)[C];2006年
8 莫倩芸;钟诚;;机群系统上并行计算时间序列的动态弯曲距离[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
9 刘萍;钟诚;;机群系统上基于映射和抽样划分的并行聚类算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
10 范曾;钟诚;莫倩芸;刘萍;;机群系统上基于Hashing的多目标串匹配并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
相关重要报纸文章 前10条
1 中国科学技术大学计算机系体系结构研究室主任 安虹;超级计算背后的英雄[N];计算机世界;2007年
2 陈文光 郑纬民;高性能计算的三大研究领域[N];计算机世界;2006年
3 ;深红: 欲挑战深蓝[N];网络世界;2002年
4 陈文光;并行计算的普及与挑战[N];中国电子报;2008年
5 宋家雨;性能魅力无法抵挡[N];网络世界;2009年
6 ;超级计算领域性能评测联想深腾表现优异[N];中国电子报;2004年
7 本报记者 刘洪宇;千万亿次HPC:软硬件挑战如何应对[N];中国计算机报;2009年
8 本报记者 刘洪宇;至强7500加速关键任务平台转型[N];中国计算机报;2010年
9 辽宁 郑大理;CPU流水线与CPU频率[N];电脑报;2005年
10 本报记者 马文方 刘洪宇 那罡;惊魂百万亿次[N];中国计算机报;2009年
相关博士学位论文 前7条
1 段然;嵌入式可重构DSP体系结构研究[D];西北工业大学;2005年
2 梁博;多核结构上的线程级推测关键技术研究[D];中国科学技术大学;2008年
3 宋宇鲲;动态可重构协处理器研究[D];合肥工业大学;2006年
4 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年
5 徐传福;计算机体系结构高效并行性能模拟技术研究[D];国防科学技术大学;2011年
6 王之元;并行计算可扩展性分析与优化[D];国防科学技术大学;2011年
7 付红;量子动力学中并行算法的发展与应用[D];中国科学院研究生院(武汉物理与数学研究所);2013年
相关硕士学位论文 前10条
1 文剑;并行计算平台的建立及性能分析[D];广东工业大学;2007年
2 尹凯;基于总线架构的多核系统编程模型及数据安全性研究[D];合肥工业大学;2009年
3 束翔;单芯片多处理器中图像匹配并行算法研究[D];国防科学技术大学;2006年
4 陈云川;面向多核处理器的嵌入式操作系统研究[D];电子科技大学;2009年
5 郭华源;序列分析并行处理技术研究[D];国防科学技术大学;2005年
6 李亮;Kylin超线程技术研究与实现[D];国防科学技术大学;2005年
7 陈露军;基于MPI的三维井地电磁场并行计算研究与实现[D];成都理工大学;2006年
8 隋兵才;X流处理器中条件流的研究与实现[D];国防科学技术大学;2006年
9 彭绍鑫;基于GPU的硬件加速方法及其在积分方程数值解中的应用[D];电子科技大学;2008年
10 袁健美;SGI服务器并行计算环境建设及并行作业管理[D];湘潭大学;2006年
本文编号:1558236
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1558236.html