基于Zynq的LS-SVM算法加速器设计
发布时间:2017-07-16 15:10
本文关键词:基于Zynq的LS-SVM算法加速器设计
更多相关文章: 异构 软硬件协同设计 片上系统 数据通路 高层次综合
【摘要】:最小二乘支持向量机LS-SVM(Least Squares Support Vector Mechine)凭借训练效率高、泛化能力强等优势被广泛应用于复杂系统的在线或实时健康管理,而在线、实时的系统健康管理平台对计算性能、功耗、体积和重量上都存在严格的约束,因此,往往依托于嵌入式计算平台实现。由于LS-SVM算法的计算复杂度高,对计算资源要求也较高,采用传统的基于FPGA的可重构计算编程实现复杂,且对计算任务调度不灵活,然而近年来,逐渐发展的异构So C凭借并行化、可定制、低功耗的优势,为复杂系统的在线实时健康管理提供了崭新的解决思路。本文基于Xilinx公司最新的Zynq系列So C,实现LS-SVM算法的嵌入式计算加速器设计,力图解决嵌入式So C中处理器系统PS(Processing System)和可编程逻辑PL(Programmable Logic)的协同设计问题,以及基于高层次综合(High Level Synthesis,HLS)开发方式的PL固件逻辑快速设计、仿真和验证问题,为以LS-SVM为代表的机器学习算法的在线或实时健康管理应用提供可行的解决方案,也为复杂算法的嵌入式高性能计算提供设计参考。首先,本文开展LS-SVM算法加速器的结构设计。根据LS-SVM算法的特点和异构So C中软硬件的处理特性,对计算任务进行合理的软硬件划分,确定PS和PL两部分的功能。进而,通过构建具有快速数据传输机制的片上系统,实现异构平台下PS和PL之间的快速数据访存。另外,针对整个算法的任务调度,进行了片上系统的控制流程设计,实现基于异构So C的流水计算。其次,在结构设计基础上,开展算法加速器的数据通路和控制程序设计。根据软硬件划分结果,将算法中的核函数计算和线性方程组求解分别予以实现。针对核函数计算模块,在PS部分进行了软件控制程序设计;而对于计算复杂度最高的线性方程组求解模块,选取乔里斯基分解(Cholesky decomposition)方法进行求解,并基于HLS开发方式进行数据通路设计,进而通过选择循环展开、循环流水等优化指令实现基于HLS的优化方案设计。最后,为了验证本课题设计的合理性和有效性,将设计的LS-SVM算法加速器应用到系统健康管理中重点关注的时间序列预测问题,并与PC平台、ARM处理器以及Virtex-5可重构计算平台,在计算效率、计算误差、资源消耗、功耗以及开发周期等方面进行了比较。最终实验表明,本文基于异构So C的LS-SVM算法加速器能够为嵌入式高性能计算应用提供一种良好的解决方案,同时,为基于HLS的开发设计提供参考。
【关键词】:异构 软硬件协同设计 片上系统 数据通路 高层次综合
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP181;TP332
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-23
- 1.1 课题来源及研究的目的和意义10-11
- 1.2 国内外研究现状分析11-20
- 1.2.1 相关基础理论11-18
- 1.2.1.1 LS-SVM算法11-13
- 1.2.1.2 Zynq So C13-15
- 1.2.1.3 HLS15-18
- 1.2.2 SVM算法加速器研究及应用现状18-20
- 1.2.2.1 SVM算法加速器研究现状18-19
- 1.2.2.2 SVM算法加速器应用现状19-20
- 1.3 主要研究内容20-22
- 1.4 论文组织结构22-23
- 第2章 LS-SVM算法加速器的结构设计23-36
- 2.1 基于Zynq So C的软硬件划分23-27
- 2.1.1 软硬件协同设计23-24
- 2.1.2 软硬件划分24-27
- 2.2 基于Zynq So C的结构设计27-33
- 2.2.1 处理器系统结构设计29-31
- 2.2.2 可编程逻辑结构设计31-33
- 2.3 LS-SVM算法的任务调度设计33-34
- 2.4 本章小结34-36
- 第3章 LS-SVM算法加速器的实现36-56
- 3.1 核函数计算模块的实现36-37
- 3.2 线性方程组求解模块的实现37-51
- 3.2.1 基于HLS的线性方程组求解模块设计38-47
- 3.2.1.1 计算模式的选择38-41
- 3.2.1.2 数据通路的设计41-47
- 3.2.2 基于HLS的线性方程组求解模块优化47-51
- 3.3 LS-SVM算法的任务调度实现51-55
- 3.4 本章小结55-56
- 第4章 LS-SVM算法加速器的性能评估56-68
- 4.1 实验设计56-60
- 4.1.1 基于Zynq So C的实验设计57-59
- 4.1.2 对比实验设计59-60
- 4.1.2.1 PC平台的实验设计59
- 4.1.2.2 ARM处理器平台的实验设计59
- 4.1.2.3 Virtex-5 动态重构平台的实验设计59-60
- 4.2 实验结果及分析60-67
- 4.3 本章小结67-68
- 结论68-70
- 参考文献70-76
- 攻读学位期间发表的学术论文及发明专利76-78
- 致谢78
【参考文献】
中国期刊全文数据库 前2条
1 James Hrica;;利用赛灵思Vivado HLS实现浮点设计[J];今日电子;2013年01期
2 王少军;刘琦;仲雪洁;彭喜元;;一种解线性最小二乘问题的FPGA计算方法[J];仪器仪表学报;2012年03期
中国博士学位论文全文数据库 前2条
1 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
2 王少军;时间序列预测的可重构计算研究[D];哈尔滨工业大学;2012年
中国硕士学位论文全文数据库 前2条
1 廖春科;SoC软硬件协同设计关键技术研究[D];国防科学技术大学;2009年
2 王淑玲;基于ZYNQ实现实时人脸检测技术的研究[D];南京理工大学;2014年
,本文编号:549256
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/549256.html