当前位置:主页 > 科技论文 > 计算机论文 >

微处理器性能分析与优化

发布时间:2020-05-11 15:14
【摘要】: 面对日益复杂的设计和有限的设计时间,如何有效地进行性能分析和优化,是摆在每一个处理器设计者面前的问题。本文紧密结合一个高性能微处理器(龙芯2号[HZL05])的设计,从性能分析环境设计和性能分析方法着手,系统地研究了微处理器性能分析和优化问题,并根据性能分析结果提出了若干龙芯2号结构优化方法。 性能分析环境的核心是目标处理器和工作负载的模型,这些模型的准确性、速度和灵活性是其关键指标。处理器的RTL模型是一种准确的模型,但是它的速度和灵活性不能满足性能分析的要求。本文提出了一种使用高级语言对硬件建模的方法,并使用它建立了龙芯2号的信号级模拟器ICT-godson。ICT-godson和RTL的逻辑行为相同,但速度可以比RTL仿真高一个数量级以上。 ICT-godson部分解决了运行速度的问题,但由于它还是模拟了所有硬件信号和行为,其速度和灵活性依然受到比较大的限制。为此本文进一步建立了一种更高层的模拟器Sim-godson。Sim-godson是一个用C语言实现的龙芯2号处理器性能模型。执行驱动的组织方式、高效的数据结构和算法以及模块化实现保证了Sim-godson的速度和灵活性。Sim-godson每秒能够模拟约500K个处理器周期,和目前公开的最快的详细模拟器相当。Sim-godson支持大程序快速评估,能够在一个小时内准确地给出SPEC CPU2000程序的性能数据。Sim-godson同时支持用户级模拟和全系统模拟,既能满足不同场合的要求,还能方便地隔离操作系统和I/O对程序性能的影响。本文还为Sim-godson建立了一个完整的验证流程,它能够有效地控制模拟器的误差。 为了充分满足不同设计阶段和设计目的的需求,性能分析环境应该由一组工具组成。除了ICT-godson和Sim-godson两种高级语言性能模型,本文建立的性能分析环境还包括RTL和FPGA仿真环境以及一些辅助的软件工具。RTL和FPGA主要用于验证高级语言模型,各种辅助工具可以用于工作负载的分析和优化。 本文为ICT-godson和Sim-godson模拟器实现了多角度的数据收集。这种方法能够从各个侧面体现目标处理器的行为,帮助设计人员发现性能瓶颈。为了更深入地理解高性能微处理器的行为,本文进一步考察了一些瓶颈分析方法。这些方法能够用来系统地确定处理器内部各类瓶颈因素的重要程度以及它们之间的关系。 最后,本文详细地讨论了龙芯2号性能分析和优化工作。我们展示了多角度的数据收集方法的实际应用,分析了龙芯2号的瓶颈,并讨论了基于性能分析的一些优化,包括Load猜测优化、存储系统优化等。本文还讨论了对SPEC CPU2000工作负载的分析,以及编译器和操作系统对性能的影响。实践证明,本文所建立的性能分析环境和分析方法能很好地满足实际高性能微处理器性能分析和优化的需求。
【图文】:

界面图,界面,检查点,内部状态


第三章 ICT-godson 模拟器的设计与优化记录到文件中。ICT-godson 实现了检查点(checkpoint)支持,它能够把某个时刻的处理器内部状态记录到文件,利用该文件以后可以迅速恢复到该时刻的状态。检查点在定位错误的过程中非常有用。例如,如果模拟器运行 10 亿拍时发现错误,我们可以每个 1 亿拍保存一个检查点,然后从离错误现象最近的检查点开始,寻找错误的根源。检查点也能用于节省性能分析的时间,例如,我们可以把操作系统完成启动时的状态保存为一个检查点,并利用这个检查点节省模拟操作系统启动的时间。3.2.3 可视化我们实现了一个基于 TCL/TK 的可视化界面,用于直观地观察处理器内部状态变化,如图 3.1 所示。这种方式能有助于理解处理器的工作原理,也可以用于分析一些典型代码段的行为。

设计矩阵


图 6.1 PB 设计矩阵(X=8)6.3 交互代价分析Fields 等人[FBH04]提出使用交互代价(interaction costs, icost)来分析微体系结构瓶颈。在这种方法里,一个性能瓶颈是一个影响执行时间的事件集合。这里的事件包括前面所说的处理器参数,也可以指一些具体事件,例如特定的一个 CACHE 不命中。一个事件的代价(cost)定义为将该事件理想化(对一个 CACHE 不命中来说,理想化就是把它换为命中;对指令窗口大小来说,则是把指令窗口设为无限大)之后能够获得的加速。设 t 为原执行时间,t(e)为将事件 e 理想化之后的执行时间,则Cost(e) = t  t(e).这个定义可以自然地扩展到一个事件集合的代价。Cost 是一个很有用的值,,比如给出一个特定 load 指令所有动态不命中的代价,可以用来决定对它预取是否值得;对于处理器设计者来说,它可以指出优化某个部件有多大的潜力。只了解单个事件的代价是不够的,因为它没有体现事件之间的交互影响。正如 6.1
【学位授予单位】:中国科学院研究生院(计算技术研究所)
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 于永佳;;微处理器I~2C总线系统保护电路维修技巧(中)[J];家电检修技术;2011年09期

2 ZW;;技术控须知 主流双核智能/平板处理器解析[J];电脑迷;2011年17期

3 田冲;;论ARM嵌入式系统的应用特点与发展[J];科技创新导报;2011年17期

4 ;综合新闻[J];上海微型计算机;1998年17期

5 邵祖林;;LG纯平MC-991A机芯保护电路维修技巧[J];家电检修技术;2011年16期

6 幸坤涛;;基于TMC246A的步进电机驱动器设计[J];电子世界;2010年03期

7 郭宏伟;;微处理器在井下排水系统的应用[J];煤;2011年07期

8 王虎升;李金环;袁宪锋;张胜春;;基于STM32的嵌入式语音播报系统的设计[J];北京联合大学学报(自然科学版);2011年03期

9 李建;夏静;;清管器中的信号发射装置电路设计[J];电子设计工程;2011年15期

10 史延东;王振华;宁飞;;基于ARM的电暖加热器的设计与实现[J];机械与电子;2011年08期

相关会议论文 前10条

1 李保社;;人为给CT埋下祸根[A];中华医学会医学工程学分会第一次医学影像设备应用技术研讨会论文集[C];1999年

2 巩恩环;赵海发;;传感器、微处理器、电子技术应用与汽车的升级换代[A];第三届河南省汽车工程科技学术研讨会暨2006年省汽学会理事会议资料[C];2006年

3 佟国香;周亦敏;温田学;吉田修;浦野启;铃木英次;;基于μpd78F9222的无刷电机控制系统的实现[A];第七届青年学术会议论文集[C];2005年

4 田倩;;SPEEDTRONIC~(TM) Mark-Ⅵ燃机控制系统简介[A];第七届工业仪表与自动化学术会议论文集[C];2006年

5 张开生;郭国法;;料仓物位仪的研制与开发[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年

6 杨宗正;;简易诊断技术用于设备中CPU及内存储器等电路的调试和维修[A];第十届全国设备监测与诊断技术学术会议论文集[C];2000年

7 凌宏江;魏必明;支合一;薛江;;智能仪器及其在型砂性能检测中的应用[A];2004中国铸造活动周论文集[C];2004年

8 吴琦;魏建中;;微处理器(CPU)的稳态电离辐射(总剂量)试验[A];第十一届全国可靠性物理学术讨论会论文集[C];2005年

9 张琪;李胜勇;管强;;基于微处理器件电路板的TPS开发研究[A];舰船电子装备维修理论与应用——中国造船工程学会电子修理学组第四届年会暨信息装备保障研讨会论文集[C];2005年

10 马敬东;;电除尘器顶部电磁振打技术应用实践[A];第十届全国电除尘、第二届脱硫学术会议论文集[C];2003年

相关重要报纸文章 前10条

1 刘霞;英美联合研制出千核微处理器[N];科技日报;2010年

2 整理 刘洪宇;386微处理器 勇于挑战巨人的大卫[N];中国计算机报;2010年

3 志强;霍夫与微处理器[N];中国石油报;2003年

4 ;安森美两相控制器为先进微处理器提供动力[N];计算机世界;2002年

5 徐淼;多核处理器起源:单芯片多核心处理器[N];中国计算机报;2007年

6 ;Sun公司再次销售微处理器[N];计算机世界;2007年

7 记者 董映璧;俄首次研制出32位计算机微处理器[N];科技日报;2003年

8 记者 陈和利;AMD向中国转让核心微处理器设计技术[N];科技日报;2005年

9 见习记者 赵洪浪;国产最快微处理器发威:3-5年手机要用“中国芯”[N];21世纪经济报道;2004年

10 卢庆儒;日新月异的微处理器工艺材料与结构设计[N];电子资讯时报;2007年

相关博士学位论文 前10条

1 张福新;微处理器性能分析与优化[D];中国科学院研究生院(计算技术研究所);2005年

2 赵天磊;微处理器Cache访问行为分析技术研究[D];国防科学技术大学;2011年

3 孙秀莉;基于动作细化的异步电路自动综合[D];中国科学院研究生院(成都计算机应用研究所);2005年

4 唐遇星;面向动态二进制翻译的动态优化和微处理器体系结构支撑技术研究[D];国防科学技术大学;2005年

5 马可;微处理器性能分析模型的建立和研究[D];中国科学技术大学;2007年

6 王蕾;异步嵌入式微处理器设计与分析关键技术研究[D];国防科学技术大学;2006年

7 刘颖;核磁共振系统的数字化研究[D];华东师范大学;2008年

8 陈黎明;嵌入式微处理器中动态可配置Cache结构的研究[D];华中科技大学;2009年

9 郭御风;面向多核微处理器芯片的高效能I/O体系结构及其实现技术[D];国防科学技术大学;2010年

10 张承义;超深亚微米微处理器漏流功耗的体系结构级优化技术研究[D];国防科学技术大学;2006年

相关硕士学位论文 前10条

1 周鹏宇;关于如何划分微处理器档次的研究[D];复旦大学;2010年

2 沈荣蓉;微处理器芯片平台测试系统的研究及优化[D];复旦大学;2010年

3 梁露潇;基于蒙特卡罗的微处理器指令测试平台设计与实现[D];北京邮电大学;2011年

4 牛小鹏;DRRAD系统研究与实现[D];解放军信息工程大学;2009年

5 李常;嵌入式MIPS微处理器设计[D];清华大学;2010年

6 胡婷婷;抗内部存储单元失效的32位微处理器的研究与实现[D];华中科技大学;2011年

7 苏博;低功耗数据触发微处理器功能单元的设计与实现[D];国防科学技术大学;2010年

8 宋政达;双路音频信号系统人机接口及双核通信的设计及实现[D];内蒙古大学;2011年

9 刘洋;基于LEON3的SoC构建及验证[D];西安电子科技大学;2010年

10 付建伟;基于OMAP-L138的数字示波器微处理器数字系统硬件设计[D];电子科技大学;2011年



本文编号:2658650

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2658650.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9e740***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com