分片式处理器体系结构上的超块优化技术
发布时间:2024-01-31 20:56
在过去的十年中,微处理器的性能以每年大约50-60%的速度提升。然而,随着芯片制造工艺逐步接近硅原子的尺寸,微处理器学术界和工业界面临着诸多尚待解决的问题:比如处理器功耗快速增长导致散热量的快速增加,芯片内部线延迟加长导致信号在单个时钟周期内所能到达的功能部件数目减少等一系列问题,处理器性能提升的两架马车——时钟频率和IPC (Instructions Per Cycle)正在失去以往的前进动力。种种迹象表明传统的处理器体系结构已经不能适应新的制造工艺的发展,各研究团队相继开发了新的处理器体系结构来取代传统的处理器体系结构,比如分片式处理器体系结构等。于此同时,新的分片式处理器体系结构对编译技术也提出了新的要求,超块形成和优化技术与分片式处理器体系结构之间的无缝融合成了值得研究的领域。 本文研究了分片式处理器体系结构的优点和潜力以及它和超块形成和优化技术之间的结合性,探讨了分片式处理器体系结构上指令之间的直接数据传送问题,提出了基于剖析信息和关键路径长度的软件扇出树生成算法与基于基本块特征的MOV指令精简启发式算法,给出了它们的理论分析,在TRIPS编译器和调度器上实现了算法并对其进行...
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
本文编号:3891537
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图3.3超块形成示例图
图3.3超块形成示例图图3.4显示了一个在超块形成之前和之后的汇编代码片段,它假设块L5是非关键块,L5没有被谓词化合并在主超块中。其中,(a)为原始CFG,(b)为原始代码,(c)为超块形成后的代码。
图3.4显示了一个在超块形成之前和之后的汇编代码片段,它假设块L5是非关键块,L5没有被谓词化合并在主超块中
图3.3超块形成示例图图3.4显示了一个在超块形成之前和之后的汇编代码片段,它假设块L5是非关键块,L5没有被谓词化合并在主超块中。其中,(a)为原始CFG,(b)为原始代码,(c)为超块形成后的代码。
图3.4超块生成前后的程序片段图
图3.3超块形成示例图3.4显示了一个在超块形成之前和之后的汇编代码片段,它假设块,L5没有被谓词化合并在主超块中。其中,(a)为原始CFG,((c)为超块形成后的代码。
图3.7循环剥离示例图
离技术的基本块不满足条件2,则可以应用循环剥离技术(Song.2002)。循环剥离技术剥离选取的基本块内一些迭代以后,外面的块就会满足条件2。当内层块内时,可以对这些超块应用循环剥离。图3.7(a)显一个里面。在应用循环剥离以后,外层循环可以谓7(b)所示。循环剥离需要先....
本文编号:3891537
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3891537.html