当前位置:主页 > 科技论文 > 计算机论文 >

嵌入式流媒体处理器体系结构技术研究

发布时间:2022-07-12 16:05
  嵌入式流媒体处理是研究如何利用有限的无线网络带宽和移动端机的计算和存储资源实现实时与可靠的流媒体传输的嵌入式应用技术领域。开发嵌入式流媒体处理器是实现这一目标的主要途径,也是嵌入式流媒体处理技术的研究重点和研究热点。 嵌入式流媒体处理器在单个SoC(System-on-a-Chip)芯片上实现了音频和视频等流媒体信号的采集、转换、编码、存储、解码、输入/输出等完整的嵌入式流媒体处理功能,具有速度快、集成度高、功耗低等优点。它在军事侦察、移动通讯、无线监控、可视电话等诸多领域有广阔的应用前景。虽然新的流媒体标准和SoC设计技术不断成熟,但要在单个SoC芯片上实现流媒体处理系统的功能,仍面临着设计复杂性高、灵活性强、设计约束苛刻、设计周期短等诸多挑战。 本文基于国际流行的嵌入式流媒体处理器系统结构框架,采用了融合算法定制和指令集扩展两种体系结构的设计思想,对计算复杂度较高的算法部分采用定制体系结构实现,对实时性要求不很高的新算法采用面积开销较小的扩展指令集进行加速和及时更新,以期在实时性能、灵活性和低功耗上取得最佳的折衷。文中重点研究了MPEG-4流媒体关键算法的定制体系结构和... 

【文章页数】:135 页

【学位级别】:博士

【文章目录】:
图索引
表索引
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
        1.1.1 流媒体技术简介
        1.1.2 视频编解码技术简介及发展趋势
        1.1.3 SOC技术发展现状及趋势
        1.1.4 嵌入式流媒体处理器的机遇与挑战
    1.2 相关研究
        1.2.1 流媒体算法复杂性分析
        1.2.2 流媒体处理器体系结构
        1.2.3 流媒体处理器体系结构比较
    1.3 研究内容
    1.4 主要工作
    1.5 论文结构
第二章 基于WALLACE树的变换与反变换体系结构
    2.1 引言
    2.2 DCT/IDCT变换硬件实现的数学推导
        2.2.1 二维DCT/IDCT算法描述
        2.2.2 一维DCT/IDCT算法
        2.2.3 常系数内积运算的硬件实现推导
    2.3 基于WALLACE树的DCT/IDCT体系结构
        2.3.1 总体结构
        2.3.2 桶形单元
        2.3.3 部分积产生
        2.3.4 基于Wallace树的部分积求和
        2.3.5 转置存储器
    2.4 基于WALLACE树的4X4整型变换与反变换体系结构
        2.4.1 H.264/AVC中的整型变换编码
        2.4.2 基于加法树的变换体系结构
        2.4.3 二维4x4并行整型变换体系结构
        2.4.4 一维4x4整型变换体系结构
        2.4.5 合并减法的Wallace树结构
        2.4.6 数据通路宽度设计
    2.5 实验结果与分析
        2.5.1 DCT/IDCT变换精度分析
        2.5.2 DCT/IDCT变换的性能与面积分析
        2.5.3 4x4整型变换的实现与分析
    2.6 本章小结
第三章 可配置的并行阵列运动估计体系结构
    3.1 引言
    3.2 快速运动估计算法分析
    3.3 运动估计体系结构
    3.4 CPAME引擎体系结构
        3.4.1 CPAME引擎设计思想
        3.4.2 PE阵列体系结构
        3.4.3 可变延时单元
        3.4.4 PE和地址产生单元
        3.4.5 SAD引擎体系结构
        3.4.6 低功耗动态控制
    3.5 体系结构性能分析
    3.6 实验结果
        3.6.1 大钻石模式搜索实例
        3.6.2 软硬件实现比较
        3.6.3 体系结构实现比较
    3.7 本章小结
第四章 预测点簇并行快速块运动估计算法及其体系结构
    4.1 引言
    4.2 PMVFAST算法分析
    4.3 多因子预测
        4.3.1 加速度预测
        4.3.2 多因子预测
    4.4 簇和基于簇的数据重用
    4.5 支持簇并行的CPAME引擎
    4.6 预测点簇并行的快速运动估计算法
        4.6.1 簇划分算法
        4.6.2 簇映射算法
        4.6.3 PCPMEFast算法
        4.6.4 PCPMEFast算法实例
    4.7 实验结果与分析
        4.7.1 预测点的簇分布统计
        4.7.2 视频质量
        4.7.3 体系结构实现
    4.8 本章小结
第五章 增强小位宽高并行嵌入式流媒体处理器体系结构
    5.1 引言
    5.2 相关研究
    5.3 ESTAR嵌入式处理器
        5.3.1 总体结构
        5.3.2 流水线体系结构
        5.3.3 指令集
        5.3.4 寄存器
        5.3.5 异常
        5.3.6 MMU
        5.3.7 Cache子系统
    5.4 ESTAR-SM体系结构
        5.4.1 小位宽高并行流媒体指令集
        5.4.2 调序访存指令
        5.4.3 流媒体指令集体系结构
        5.4.4 指令执行周期
        5.4.5 寄存器
        5.4.6 指令格式
    5.5 实验结果与分析
        5.5.1 原型实现
        5.5.2 性能评价
    5.6 本章小结
第六章 具有定制增强特征的嵌入式流媒体SoC设计方法
    6.1 引言
    6.2 基于平台的SOC设计方法
    6.3 定制增强设计方法
        6.3.1 算法选择及其描述
        6.3.2 体系结构行为级描述
        6.3.3 体系结构探索
        6.3.4 通信细化
        6.3.5 RTL细化
    6.4 软硬件协同模拟框架
    6.5 实验结果与分析
        6.5.1 嵌入式流媒体SoC平台
        6.5.2 模拟性能
        6.5.3 设计重用
        6.5.4 综合质量
    6.6 本章小结
第七章 结束语
    7.1 主要贡献
    7.2 研究展望
致谢
攻读博士期间已发表和撰写的论文
攻读博士期间参与的主要科研项目
参考文献



本文编号:3659429

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3659429.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户143d1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com