高性能BWDSP处理器指令Cache研究与设计
发布时间:2018-04-16 17:45
本文选题:高性能 + BWDSP处理器 ; 参考:《合肥工业大学》2013年博士论文
【摘要】:信号处理技术被广泛应用于雷达、电子对抗、通信、声纳、语音视频等领域。随着这些领域各种器件和技术的进一步发展,市场对密集型数字信号处理的运算精度和速度提出了更高的要求。当前,用于数字信号处理的器件有专用ASIC器件、通用可编程逻辑(FPGA)器件和通用DSP处理器。其中,专用ASIC器件由于其灵活性方面的局限,已无法满足市场和应用的需求。此种情况下,利用通用可编程逻辑器件(FPGA)和通用DSP处理器构建的数字信号处理通用平台技术则随着集成电路技术、计算机技术和工艺水平的快速发展日趋成熟。 近年来,伴随密集型数字信号处理技术本身的发展以及现代电子系统功能模式的繁多复杂,市场对以数字信号处理器件为核心的数字信号处理系统提出了新的要求,如具有处理矢量信号、宽频带(信号处理带宽不断加大)信号的能力,具有大动态范围的增益和频带实时可变等。技术上是否采用高性能数字信号处理器已成为提高整个数字信号处理系统性能和可靠性的重要措施。通用DSP处理器具有动态范围大,精度高、可通过编程方式来实现特定算法的优势。近25年来,尽管DSP处理器得到了快速发展,但目前国内所使用DSP芯片主要从国外进口,这势必给我国的国家安全和信息产业带来不利的影响。因此,如何自主研制DSP处理器芯片成为我国数字信号处理技术发展亟待解决的问题。 为改变DSP芯片对国外产品技术的依赖,同时为满足国内市场的巨大需求,近年来中国电子科技集团第38研究所对高性能DSP处理器进行了专项研究,并成功研制出魂芯一号(BWDSP100处理器)芯片。高速缓存器(Cache)能有效解决DSP处理器内核运算速度与存储器访存速度不匹配问题,从而有效地提高DSP处理器运算能力。随着DSP处理器的功能日益强大,软件程序的复杂程度也在不断增大,软件的代码量迅速增加,同时DSP处理器需要强大编译器支持来实现各种应用程序,如循环展开优化编译器性能造成指令代码膨胀,采用无损数据压缩技术对经过编译、汇编后生成二进制机器指令代码进行压缩,减少指令代码存储空间大小,这样在DSP处理器存储空间有限条件下可以存储更多指令程序代码,同时增加Cache命中率,提高BWDSP处理器整体性能。指令Cache设计和压缩指令代码大小成为BWDSP处理器设计需要考虑的问题。本文结合中国电子科技集团第38研究所自主研制的高性能BWDSP处理器,从指令Cache设计、指令代码压缩方面展开研究工作。 1)IC工艺发展28nm,高性能BWDSP处理器将取代国外DSP处理器产品。指令Cache性能是影响BWDSP处理器性能的主要因素之一,Cache替换算法是影响Cache性能的主要因素。本文提出4路PLRU的Cache替换算法。PLRU(Pseudo-LRU)替换算法是在指令Cache增加一个8bitlru[7:0]的矢量,,当Cache命中某路更新lru[7:0]上的值;当Cache缺失时,根据lru[7:0]值来确定替换哪Cache块并且更新lru[7:0]的值。通过BWDSP模拟器对PLRU替换算法、指令Cache容量大小、Cache块大小、组相联映射进行仿真实验,最终得出指令Cache一组最优参数。 2)高性能BWDSP处理器指令代码压缩。研究高性能BWDSP处理器以跳转块为代码压缩单元,利用LZW字典压缩和改进LZW字典压缩对指令代码经编译器和汇编器后生成二进制机器代码进行压缩,压缩的代码存储在指令存储器中,在指令存储器与指令Cache之间有译码单元。该方法不需要改变高性能BWDSP处理器的编译器、汇编器和BWDSP处理器内核流水线的级数。当指令Cache缺失时,译码单元对指令存储器存储的压缩代码进行解压。指令代码的跳转块首地址为行地址映射表(LAT)中一项的基地址,指令跳转块的指令地址就为LAT基地址加偏移地址得到。利用LAT来表示压缩前代码的地址和压缩后代码的地址对应关系,这样就能保证高性能BWDSP处理器的内核能够随机访问指令代码。在高性能BWDSP处理器指令代码压缩模拟器进行仿真,仿真结果表明代码压缩率在60%和55%左右。 3)基于执行宏和指令域的代码压缩方法。研究指令域的代码压缩方法。该方法分为符号生成、符号建模和符号编码三个步骤。一条指令生成几个符号以及符号模型的建立对代码压缩率起着重要作用。本文以指令位置、指令类型和执行宏高阶模型来充分挖掘不同类型指令域内部符号之间的相关性。将执行宏模型和位置模型组合执行宏-位置混合模型,并用Huffman编码实现代码压缩。以高性能BWDSP处理器指令集,在高性能BWDSP处理器开发平台验证用Huffman编码对执行宏-位置混合模型生成符号的进行代码压缩,并得到50%左右的压缩率。 4)为了保证高性能BWDSP处理器指令Cache设计的功能完备性,提出对高性能BWDSP处理器指令Cache功能验证。利用功能覆盖率对指令Cache设计的全部功能的描述转换。软件仿真器模型和RTL模型构建指令Cache功能验证测试平台。针对指令Cache中访存指令得出测试要求。最后得出覆盖率报告结果表明功能覆盖率达到100%。
[Abstract]:The signal processing technology is widely used in the fields of radar , electronic countermeasure , communication , sonar , voice and video . With the further development of various devices and technologies in these fields , the market has higher requirements for the operation precision and speed of intensive digital signal processing .
In recent years , with the development of intensive digital signal processing technology itself and the complexity of modern electronic system function model , the market has proposed new requirements for digital signal processing system with digital signal processor as its core .
In order to change the dependence of DSP chip on foreign product technology , in order to meet the huge demand of domestic market , in recent years , China ' s electronics and technology group has made a special research on high - performance DSP processor and has successfully developed the core - 1 ( BWDSP100 processor ) chip .
The performance of instruction cache is one of the main factors that affect the performance of BWDSP processor . Cache replacement algorithm is one of the main factors that affect the performance of the cache . In this paper , a 4 - way PLRU cache replacement algorithm is proposed .
When the cache is missing , determine which cache block is replaced and update the value of lru cache 7 : 0 according to the value of lru cache 7 : 0 . Through the BWDSP simulator , the PLRU replacement algorithm , the instruction cache capacity size , the Cache block size and the group associative mapping are simulated experiments , and finally , a set of optimal parameters of the instruction cache is obtained .
The invention discloses a high - performance BWDSP processor instruction code compression , which comprises the following steps :
3 ) Code compression method based on execution macro and instruction field . The method is divided into three steps : symbol generation , symbol modeling and symbol coding .
4 ) In order to guarantee the function completeness of instruction cache design of high - performance BWDSP processor , the instruction cache function verification of high - performance BWDSP processor is put forward . The function coverage is used to describe all functions of instruction cache design . The software simulator model and RTL model are used to build instruction cache function verification testing platform .
【学位授予单位】:合肥工业大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP332
【参考文献】
相关期刊论文 前4条
1 陈书明;李振涛;万江华;胡定磊;郭阳;汪东;扈啸;孙书为;;“银河飞腾”高性能数字信号处理器研究进展[J];计算机研究与发展;2006年06期
2 李明,唐志敏;一种新的Cache优化方法──部分Cache局部性方法[J];计算机学报;1997年01期
3 夏军,杨学军,曾丽芳,周海芳;基于投影分层技术的嵌套循环空间局部性优化方法[J];计算机学报;2003年05期
4 陈文智;姜振宇;吴帆;;基于MIPS体系的扩展指令融合技术[J];计算机学报;2008年11期
本文编号:1759956
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1759956.html