当前位置:主页 > 科技论文 > 计算机论文 >

面向粗粒度可重构处理器REmusII的任务编译器后端设计

发布时间:2021-03-09 20:10
  REmusII系统是“十一五”863计划重点项目“嵌入式可重构移动媒体处理核心技术”设计的粗颗粒度可重构处理器。本文设计出REmusII系统的编译器的后端,编译器后端将数据流图(DFG)映射到REmusII的可重构阵列上,并生成REmusII可识别的配置字文件。整个过程涉及到包含数据传输方式、数据存储方式、时域划分、任务调度等策略的整个编译器后端流程的设计,流程的代码实现和硬件可识别配置字生成的实现。同时根据硬件的数据2D存取方式,对可重构阵列内部和外部存储器分别进行了内存分区调度管理,提高了数据存取的效率。本文给出了编译器后端的执行过程和结果,以DCT32为例介绍了编译器后端处理单个DFG的过程,并通过对akiyoqcif,containerqcif,suzieqcif三个测试视频(qcif,175x144)码流的测试,证明了编译器后端功能的正确性,符合项目的要求。为了进一步提高性能,本文在DFG映射过程中的时域划分部分引入了微粒群优化算法(PSO),并同时考虑到划分块数、通信量和资源利用率三个主... 

【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:99 页

【学位级别】:硕士

【部分图文】:

面向粗粒度可重构处理器REmusII的任务编译器后端设计


可重构系统通用编译流程

系统组成,指定数据


11图 2-3 REmusII 系统组成图Fig. 2-3 Components of REmusII2.2 数据传输和存储模式2.2.1 RCA External Data Transfer(REDT)REDT 将来自片外 SSRAM 的外部数据导入至 RPU 中的 4 个 8x8 RCA 的指定数据目标,或将来自RPU的4个8x8RCA的指令数据源的数据导出为片外SSRAM的外部数据,该模块由 REDA、REDL 和 REDS 三个部分构成:REDL 通过访问EMI 读取片外 SSRAM 中的数据写至 RPU 内某个 8x8 RCA 中的 ELDF;REDS 通过访问 EMI 读取 RPU 内某个 8x8 RCA 中的 ESDF 中的数据写至片外 SSRAM;REDA 仲裁 REDL 和 REDS 的 EMI 访问请求,优先完成 REDS。

结构图,结构图,可重构硬件,阵列


图 2-4 8x8 RCA 结构图Fig.2-4 8x8 RCA Architecture构图如图 2-4 所示,RCA 每行之间的节点只能和ut FIFO 和 Output FIFO 可以连接到 RCA 上的任,一次配置,多次循环计算。64 个计算阵列可以行流程配置字(Context)的可重构硬件架构,它的分RPU 采用了三层的配置机制:CL0 层、CL1 层息构成,具体的介绍如下:的配置信息,称为 Core Context,用于配置 8x8点的输入、输出和操作符,是对整个 RCA 阵列lobal Context Group Memory)用于存储 CL2 层次为 256bit,深度为 512,总大小为 16KB 的单端口

【参考文献】:
期刊论文
[1]嵌入式粗颗粒度可重构处理器的软硬件协同设计流程[J]. 于苏东,刘雷波,尹首一,魏少军.  电子学报. 2009(05)
[2]基于模板的SoC结构自动划分方法[J]. 韩睦华,刘雷波,魏少军.  计算机辅助设计与图形学学报. 2009(05)
[3]可重构系统中的实时任务在线调度与放置算法[J]. 周学功,梁樑,黄勋章,彭澄廉.  计算机学报. 2007(11)
[4]动态可重构系统任务时域划分算法[J]. 潘雪增,孙康,陆魁军,王继民,平玲娣.  浙江大学学报(工学版). 2007(11)
[5]基于排序优化的微粒群算法[J]. 祝成虎,彭宏.  计算机工程与设计. 2006(21)
[6]基于簇的层次敏感的可重构系统任务划分算法[J]. 周博,邱卫东,谌勇辉,彭澄廉.  计算机辅助设计与图形学学报. 2006(05)



本文编号:3073405

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3073405.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a1af8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com