当前位置:主页 > 科技论文 > 计算机论文 >

NUMA架构的龙芯3A板级设计及工程化技术研究

发布时间:2019-07-24 17:55
【摘要】:针对关键应用对信息处理能力提出的性能要求以及国产化需求,在分析龙芯3A处理器架构特点的基础上,设计了基于NUMA并行处理架构的龙芯3A高性能处理模块,并对抗恶劣环境的关键问题进行了分析和设计,解决了散热、电源监控及供电优化、启动速度等问题。通过测试验证,性能可以满足关键应用对信息处理能力的要求,从而有效解决了龙芯3A访存能力有限的问题。同时对SMP和NUMA架构下,龙芯3A处理器CPU数量的增加对访存性能的提升的关系进行了探讨。
【图文】:

NUMA架构的龙芯3A板级设计及工程化技术研究


为不用跨XBAR访问)。在NUMA并行机中,虽然存储器在物理上分别挂载到各节点上,但它们可以被系统内所有的处理器统一访问或共享,这为NUMA系统带来了存储一致性问题[14],这种数据不一致现象不仅可以存在于SMP中[15],同时也存在于NUMA系统中。龙芯3A处理器采用基于目录协议的高速缓存一致性(CacheCoherent)技术来解决存储一致性问题[16]。在CC-NUMA系统中,每个处理器核有一个私有高速缓冲存储器,硬件自动维护各私用高速缓存一致性。CPU经常在它的高速缓存中取指令和存储数据,以获得较好的性能。如图2所示。3基于龙芯3A的NUMA架构的板级设计根据前述章节的架构规划,本章将详述基于龙芯3A的NUMA架构工程化技术,并形成基于VPX的双路3A处理器的并行处理单板COTS产品(以下简称NUMA处理模块),提高了整板计算密度和性能功耗比。该模块可进行大数据量计算,具有任务网络、控制总线等接口,既可用于数据处理、状态监测、任务统一管理调度,数据管理、程序文件的处理,也可用于各功能计算、数据融合等任务处理。NUMA处理模块采用模块化设计,如图3,模块由双龙芯3A处理器、内存、FLASH、铁电、EEPROM、PMC接口、南桥单元、北桥单元、千兆以太网单元、逻辑芯片、总SATA电源监控I2CGA[4:1]12VSB710SMBUSVPXP0BMC温度传感器BOOTROMUART1TTLLPCUART0DDR2MC0LS3AHTch0x16LS3A千兆以太网HX5020NLIntel82574Intel82574SidePortMemory128MBGPPPCI-Ex1GPPPCI-Ex1GPPPCI-Ex4VPXP1XMCVPXP2PapidIO/MRCGFXPCI-Ex4VPXP4HTch1x16UART0VPXP3SO-DIMM内存条SO-DIMM内存条DDR2MC0显示VGAVGAVPXP5AMD780ELVDSLVDSVPXP5STAT_LE

NUMA架构的龙芯3A板级设计及工程化技术研究


杓?技术4.1散热设计单龙芯3A处理器运行在1GHz时的平均功耗为15W左右,峰值功耗可达到25W左右,运行在800MHz情况下,平均功耗也有将近12W左右,功率是同频率对应性能PowerPC处理器的2~3倍,双路处理器则功耗加倍。受限于加固计算机系统的尺寸要求,无法给处理器配置独立的大尺寸散热器及风扇,只能采用板卡加固壳体与机箱箱体接触来实现散热。设计完成第一版板卡及加固壳之后,在室温下进行了单板温度验证,通过温度传感器对CPU及CPU供电芯片进行了工作升温测试,温度曲线并不理想,CPU供电芯片温度接近90℃,,如图4所示。通过进一步分析板卡电路及壳体结构,采取了如下改进措施:(1)优化了供电芯片的电路及开关频率。(2)调整了芯片布局,避免热源过于集中。(3)采用高导热特性的导热硅脂连接芯片及壳体。(4)增大壳体散热面积,采用整体式壳体,减少接触面。通过上述措施,经过第二轮改版,在相同条件下进行测试,温度曲线有了明显改善,升温速度减慢,稳定温度也有明显降低。温度曲线如图5所示。4.2电源监控及优化设计以往基于龙芯3A处理器的板卡的供电大多采用外接MOSFET以及电感的DC-DC电源芯片形式,电源轨1009080706050403020100度温/℃时刻0:00:400:800:210:610:020:420:820:230:630:040:40:840:250:651:01:401:801:211:611:02CPU电源CPU图4第一版板卡温度曲线0:00:400:800:210:610:020:420:820:230:630:040:40:840:250
【作者单位】: 北方信息控制集团计算所;
【分类号】:TP332

【参考文献】

相关期刊论文 前10条

1 施继成;陈海波;臧斌宇;;面向多处理器虚拟机的动态NUMA方法[J];小型微型计算机系统;2015年04期

2 刘柯;;多核处理器Cache一致性的改进[J];西安邮电大学学报;2015年02期

3 夏军;徐炜遐;庞征斌;张峻;常俊胜;;用于减少远程Cache访问延迟的最后一次写访问预测方法[J];国防科技大学学报;2015年01期

4 苏淑霞;;基于SMP的Linux进程调度算法的研究[J];信息与电脑(理论版);2014年12期

5 迟利华;胡庆丰;刘杰;甘新标;蒋杰;晏益慧;;面向FT1000微处理器的STREAM并行计算与优化[J];计算机工程与科学;2014年12期

6 徐地;武成岗;冯晓兵;;一个支持访存带宽敏感调度的跨执行优化方法[J];计算机学报;2014年07期

7 曹越;顾乃杰;任开新;张旭;吴志强;;一种面向多核系统的Linux任务调度算法[J];计算机工程;2015年02期

8 阮利;秦广军;肖利民;祝明发;;基于龙芯多核处理器的云计算节点机[J];通信学报;2013年12期

9 王磊;;并行计算技术综述[J];信息技术;2012年10期

10 贾小敏;张民选;齐树波;赵天磊;;片上多核Cache资源管理机制研究[J];计算机科学;2011年01期

【共引文献】

相关期刊论文 前10条

1 陈亮强;钱振江;;一种Minix进程调度的改进算法[J];常熟理工学院学报;2017年02期

2 黄益彬;郑卫波;宋子锋;;操作系统客体重用安全的研究[J];计算机技术与发展;2017年05期

3 王宁;;一种基于集群的通用并行计算框架设计[J];现代计算机(专业版);2016年35期

4 赵东阳;刘瑞;孟英谦;;NUMA架构的龙芯3A板级设计及工程化技术研究[J];计算机工程与应用;2017年08期

5 韩彦峰;王家序;周广武;肖科;;滑动轴承混合润滑多线程并行计算数值方法[J];华中科技大学学报(自然科学版);2016年06期

6 余双春;袁杰;;复频域实时重建医学光声图像的研究[J];南京大学学报(自然科学);2016年03期

7 曹绍华;薛华威;;基于DTTL模型的DNS自适应缓存机制研究[J];中国电子科学研究院学报;2016年02期

8 单蓉;;基于Linux的集群系统建设与研究[J];电子设计工程;2016年04期

9 蒋少丙;刘书刚;;面向过程的任务并行化设计方法[J];计算机系统应用;2015年09期

10 张岳峰;方红卫;张红武;钟德钰;赵慧明;王新军;;DWSM动态并行计算技术[J];水利水电科技进展;2015年03期

【二级参考文献】

相关期刊论文 前10条

1 夏厦;李俊;;基于缓存竞争优化的Linux进程调度策略[J];计算机工程;2013年04期

2 王绍刚;徐炜遐;庞征斌;吴丹;戴艺;陆平静;;PMESI:一种优化进程私有数据访问的缓存一致性协议[J];国防科技大学学报;2013年01期

3 戴月华;齐勇;任建宝;王晓光;史i8;宣宇;;Trochilidae:面向众核平台的高性能轻量级虚拟机监控器[J];计算机科学与探索;2012年12期

4 阮利;肖利民;祝明发;;基于内容解析的容灾备份存储系统桌面虚拟化存储优化方法(英文)[J];中国通信;2012年07期

5 张伟;宋莹;阮利;祝明发;肖利民;;面向Internet数据中心的资源管理[J];软件学报;2012年02期

6 李锋涛;郑晓曦;;基于SMP结构的linux内核进程调度的研究[J];数字技术与应用;2011年11期

7 王磊;曹菡;;基于TBB和Cilk++的并行蚁群算法在路径寻优中的应用[J];计算机应用;2010年10期

8 戴月华;史i8;谢锋涛;冯雨声;齐勇;;基于cc-NUMA多核处理器构架的虚拟机监控器原型设计与实现[J];计算机与数字工程;2010年08期

9 赵旭;夏靖波;;基于RTAI的Linux系统实时性研究与改进[J];计算机工程;2010年14期

10 朱旭;杨斌;刘海涛;;完全公平调度算法分析[J];成都信息工程学院学报;2010年01期

【相似文献】

相关期刊论文 前10条

1 ;为企业拓展新架构[J];市场与电脑;2002年04期

2 励江一;;多业务与三层架构业务办理系统[J];中国数字电视;2009年09期

3 高伟峰;容振邦;林子慧;;多层架构技术在信息管理系统中的应用[J];福建电脑;2007年05期

4 ;瞻博提出“3-2-1”架构以简化数据中心网络[J];计算机安全;2010年06期

5 李舒磊;;云计算及其架构技术研究[J];中小企业管理与科技(下旬刊);2013年06期

6 王强;;基于混合架构的医院综合集成系统[J];中国医疗设备;2014年02期

7 ;突破障碍 实现创新——Power Architecture Conference 2009 China在北京召开[J];中国集成电路;2009年11期

8 李晓娟;;银行业面临架构转型[J];金融科技时代;2012年12期

9 夏平平;杨威;;基于开源架构的电力行业考试系统开发和研究[J];江西电力;2006年02期

10 李纲;冯娟;苏厚勤;;基于三层架构的描述性数据统计分析[J];计算机应用与软件;2007年08期

相关会议论文 前3条

1 李志翔;杨威;;基于开源架构的电力行业考试系统研究[A];第三届浙江中西部科技论坛论文集(第四卷 电力分卷)[C];2006年

2 郑晓强;王昂;史有群;;义齿行业ERP中的订单跟踪与预警[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 鲁远祥;樊荣;;煤矿安全监控系统体系架构技术的发展[A];中国煤炭学会煤矿安全专业委员会2009年学术研讨会论文集[C];2009年

相关重要报纸文章 前10条

1 康妮;IBM能否实现“PowerEverywhere”战略[N];中国电子报;2005年

2 ;实施SOA分四步走[N];网络世界;2006年

3 阿刚;“桥”的妙处[N];中国计算机报;2002年

4 本报记者 王皓;企业级X-架构双翼齐飞[N];计算机世界;2003年

5 谢文砚 贺宏良;Power.org唤醒了什么[N];中国计算机报;2004年

6 普元软件副总裁 程朝晖;我们的事业:基础架构抹平一切[N];中国计算机报;2006年

7 乐天;多租户架构对云很重要[N];计算机世界;2010年

8 阳子;拿来主义与自主创新[N];中国民航报;2005年

9 本报记者 张群英;芯片业的第4条路[N];网络世界;2004年

10 王如晨;AMD欲以技术换市场?[N];第一财经日报;2005年

相关博士学位论文 前2条

1 王耀力;基于云架构的存储信息系统研究[D];太原理工大学;2012年

2 胡书山;基于物联网的智慧家庭架构及其关键技术研究[D];武汉大学;2014年

相关硕士学位论文 前10条

1 黄崴;通用积分账户系统的设计与实现[D];复旦大学;2013年

2 温敏;基层公安治安管理系统的设计与实现[D];电子科技大学;2014年

3 吴剑浪;多用途航空飞行实验室(AFL)体系架构研究[D];电子科技大学;2015年

4 杨忠国;基于多层架构技术的企业客户关系管理系统的设计与实现[D];电子科技大学;2015年

5 徐楠;在线书籍阅读平台的设计与实现[D];西安电子科技大学;2015年

6 孟庆柳;基于三层架构的肺部内污染检测软件设计与实现[D];成都理工大学;2015年

7 姜子赫;Lean Dealer System(LDS)基于SOA架构的汽车经销商售后服务解决方案[D];天津大学;2014年

8 王一超;基于3D-EW算法的Intel KNC架构下的性能分析与调优[D];上海交通大学;2015年

9 王甜驹;车身部件协同CAD/CAE架构研究与实现[D];大连理工大学;2016年

10 林淙源;面向资源体系架构的Web政务系统的设计与实现[D];西安电子科技大学;2015年



本文编号:2518792

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2518792.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6b66c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com