基于异构计算平台的推荐算法加速器的研究与实现
发布时间:2021-07-11 09:22
在移动互联蓬勃发展的当下,任何与用户打交道并希望获得较好用户体验的系统都离不开一套完备的推荐系统。随着系统数据体量的增长,各种推荐算法需要花费更长的时间来处理来自用户的海量数据。为了让推荐系统对输入数据进行响应并处理后更快地将推荐结果呈现给用户,加快推荐算法的执行速度成为了亟待解决的问题。目前针对现有的各种推荐算法,主要采用云计算平台,分布式通用处理器平台,和图形处理器平台进行硬件加速。这些方法虽然在一定程度上提升了推荐算法的运行效率,但同时伴随而来的能效和成本等问题也是不容忽视的。本文选用一种由通用处理器(CPU)和现场可编程门阵列(FPGA)组成的异构计算平台来对推荐算法的硬件加速相关问题进行研究。它的主处理器(CPU)可以对整个系统进行控制,同时完成一些简单的数据处理任务;协处理器(FPGA)本身的功耗非常低,且拥有大量的逻辑运算单元可以用来执行耗时的任务。两者相互协作,获得算法执行时整体功耗的降低和效率上的提升。本文的研究工作主要包括以下几个方面:1.从目前较为流行推荐算法中,选取基于内容的推荐算法、基于协同过滤的推荐算法和基于关联规则推荐算法的原理进行研究,针对基于关联规则的...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:100 页
【学位级别】:硕士
【部分图文】:
通用处理器计算性能发展【,们‘倒..白灿口
在CPU-FPGA异构架构中,FPGA作为一种高性能,低功耗的可编程芯片,??不再使用软件或者指令,而是直接将硬件描述语言编译成晶体管电路组合,大大??提高计算效率,更接近10。图2-3展示了可编程FPGA的内部原理图。通常FPGA??的计算能力可以达到1.8TFL0Ps/s。??I?%?§?I?|???^...............1\??K3I???〇*?*?—撕'—〇??*?.^L??一.?????I、二;:...-*?!!?m?MMMMMV??mmmmmmm?M??^0^??1 ̄ ̄*-—<! ̄?一*1?????1?^??????**-—14—r——rr—***?4?S—r???4HC^CU?>?■,‘今?,一?-?????>??…M??■Oli?一????????????,Mll?丨?.丨,丨丨丨?iiri???|n||?丨丨丨m?..山.."…微??tsg>g^KX-r<itmf???I—-|?— ̄I—?????L.J..???—??i?l?i?£?|?£?i??图2-3?FPGA内部结构[19]??在CPU-ASIC这个特殊的架构中,与传统芯片不同的是,ASIC芯片是专用??的,它能够依据算法来定制需要的计算能力与效率,具体优势有:①计算能力高;??②计算效率好;③功耗低;④占用空间小(体积小);⑤芯片成本与出货量呈反??t匕,数量越多,成本越低114]。当然其专属性也决定了其具有一定的不足,如计算??方法是固定的;而与同行业的FPGA进行比较的话
?GPU??图2-2?GPU内部结构[w]??在CPU-FPGA异构架构中,FPGA作为一种高性能,低功耗的可编程芯片,??不再使用软件或者指令,而是直接将硬件描述语言编译成晶体管电路组合,大大??提高计算效率,更接近10。图2-3展示了可编程FPGA的内部原理图。通常FPGA??的计算能力可以达到1.8TFL0Ps/s。??I?%?§?I?|???^...............1\??K3I???〇*?*?—撕'—〇??*?.^L??一.?????I、二;:...-*?!!?m?MMMMMV??mmmmmmm?M??^0^??1 ̄ ̄*-—<! ̄?一*1?????1?^??????**-—14—r——rr—***?4?S—r???4HC^CU?>?■,‘今?,一?-?????>??…M??■Oli?一????????????,Mll?丨?.丨,丨丨丨?iiri???|n||?丨丨丨m?..山.."…微??tsg>g^KX-r<itmf???I—-|?— ̄I—?????L.J..???—??i?l?i?£?|?£?i??图2-3?FPGA内部结构[19]??在CPU-ASIC这个特殊的架构中
【参考文献】:
期刊论文
[1]深度学习FPGA加速器的进展与趋势[J]. 吴艳霞,梁楷,刘颖,崔慧敏. 计算机学报. 2019(11)
[2]基于Vivado HLS的Canny算法实时加速设计[J]. 谭检成,吴定祥,李明鑫,唐立军. 电子技术应用. 2018(09)
[3]用Vivado HLS实现粒子滤波算法的硬件加速[J]. 高国栋,林明. 江苏科技大学学报(自然科学版). 2018(02)
[4]基于遗传算法的Vivado HLS硬件加速[J]. 陈宝林,黄晞,张仕,郭升挺,吴家飞,苏浩明. 计算机系统应用. 2018(01)
[5]基于Hadoop的推荐算法实现[J]. 黄鑫,景亮. 自动化技术与应用. 2017(10)
[6]基于Zedboard的图像旋转硬件加速系统实现[J]. 陈高琳. 福建电脑. 2017(08)
[7]一种基于MapReduce的微博信息推荐并行算法[J]. 刘其成,冯利光. 小型微型计算机系统. 2017(07)
硕士论文
[1]基于FPGA和深度学习算法的硬件加速设计与研究[D]. 景亮亮.成都理工大学 2018
[2]基于ZYNQ的混合验证门禁系统的研究与实现[D]. 张俊喆.北京邮电大学 2018
[3]基于云计算的推荐系统的研究与设计[D]. 张高鹏.西安电子科技大学 2017
[4]云计算环境下的电子商务推荐系统关键技术研究[D]. 蔡蕊.北京信息科技大学 2017
[5]基于FPGA的矩阵奇异值分解加速方案的设计与实现[D]. 马亚峰.北京交通大学 2017
[6]基于Hadoop的电子商务个性化推荐研究与实现[D]. 冀晓岩.兰州交通大学 2017
[7]基于HLS的Tiny-yolo卷积神经网络加速研究[D]. 张丽丽.重庆大学 2017
[8]PCI总线多功能扩展卡IP核的设计与实现[D]. 徐继彬.北京邮电大学 2017
[9]基于多核DSP的深度学习算法硬件加速技术研究[D]. 纪昆.国防科学技术大学 2016
[10]基于FPGA的聚类算法的加速平台的研究与设计[D]. 贾发慧.中国科学技术大学 2016
本文编号:3277811
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:100 页
【学位级别】:硕士
【部分图文】:
通用处理器计算性能发展【,们‘倒..白灿口
在CPU-FPGA异构架构中,FPGA作为一种高性能,低功耗的可编程芯片,??不再使用软件或者指令,而是直接将硬件描述语言编译成晶体管电路组合,大大??提高计算效率,更接近10。图2-3展示了可编程FPGA的内部原理图。通常FPGA??的计算能力可以达到1.8TFL0Ps/s。??I?%?§?I?|???^...............1\??K3I???〇*?*?—撕'—〇??*?.^L??一.?????I、二;:...-*?!!?m?MMMMMV??mmmmmmm?M??^0^??1 ̄ ̄*-—<! ̄?一*1?????1?^??????**-—14—r——rr—***?4?S—r???4HC^CU?>?■,‘今?,一?-?????>??…M??■Oli?一????????????,Mll?丨?.丨,丨丨丨?iiri???|n||?丨丨丨m?..山.."…微??tsg>g^KX-r<itmf???I—-|?— ̄I—?????L.J..???—??i?l?i?£?|?£?i??图2-3?FPGA内部结构[19]??在CPU-ASIC这个特殊的架构中,与传统芯片不同的是,ASIC芯片是专用??的,它能够依据算法来定制需要的计算能力与效率,具体优势有:①计算能力高;??②计算效率好;③功耗低;④占用空间小(体积小);⑤芯片成本与出货量呈反??t匕,数量越多,成本越低114]。当然其专属性也决定了其具有一定的不足,如计算??方法是固定的;而与同行业的FPGA进行比较的话
?GPU??图2-2?GPU内部结构[w]??在CPU-FPGA异构架构中,FPGA作为一种高性能,低功耗的可编程芯片,??不再使用软件或者指令,而是直接将硬件描述语言编译成晶体管电路组合,大大??提高计算效率,更接近10。图2-3展示了可编程FPGA的内部原理图。通常FPGA??的计算能力可以达到1.8TFL0Ps/s。??I?%?§?I?|???^...............1\??K3I???〇*?*?—撕'—〇??*?.^L??一.?????I、二;:...-*?!!?m?MMMMMV??mmmmmmm?M??^0^??1 ̄ ̄*-—<! ̄?一*1?????1?^??????**-—14—r——rr—***?4?S—r???4HC^CU?>?■,‘今?,一?-?????>??…M??■Oli?一????????????,Mll?丨?.丨,丨丨丨?iiri???|n||?丨丨丨m?..山.."…微??tsg>g^KX-r<itmf???I—-|?— ̄I—?????L.J..???—??i?l?i?£?|?£?i??图2-3?FPGA内部结构[19]??在CPU-ASIC这个特殊的架构中
【参考文献】:
期刊论文
[1]深度学习FPGA加速器的进展与趋势[J]. 吴艳霞,梁楷,刘颖,崔慧敏. 计算机学报. 2019(11)
[2]基于Vivado HLS的Canny算法实时加速设计[J]. 谭检成,吴定祥,李明鑫,唐立军. 电子技术应用. 2018(09)
[3]用Vivado HLS实现粒子滤波算法的硬件加速[J]. 高国栋,林明. 江苏科技大学学报(自然科学版). 2018(02)
[4]基于遗传算法的Vivado HLS硬件加速[J]. 陈宝林,黄晞,张仕,郭升挺,吴家飞,苏浩明. 计算机系统应用. 2018(01)
[5]基于Hadoop的推荐算法实现[J]. 黄鑫,景亮. 自动化技术与应用. 2017(10)
[6]基于Zedboard的图像旋转硬件加速系统实现[J]. 陈高琳. 福建电脑. 2017(08)
[7]一种基于MapReduce的微博信息推荐并行算法[J]. 刘其成,冯利光. 小型微型计算机系统. 2017(07)
硕士论文
[1]基于FPGA和深度学习算法的硬件加速设计与研究[D]. 景亮亮.成都理工大学 2018
[2]基于ZYNQ的混合验证门禁系统的研究与实现[D]. 张俊喆.北京邮电大学 2018
[3]基于云计算的推荐系统的研究与设计[D]. 张高鹏.西安电子科技大学 2017
[4]云计算环境下的电子商务推荐系统关键技术研究[D]. 蔡蕊.北京信息科技大学 2017
[5]基于FPGA的矩阵奇异值分解加速方案的设计与实现[D]. 马亚峰.北京交通大学 2017
[6]基于Hadoop的电子商务个性化推荐研究与实现[D]. 冀晓岩.兰州交通大学 2017
[7]基于HLS的Tiny-yolo卷积神经网络加速研究[D]. 张丽丽.重庆大学 2017
[8]PCI总线多功能扩展卡IP核的设计与实现[D]. 徐继彬.北京邮电大学 2017
[9]基于多核DSP的深度学习算法硬件加速技术研究[D]. 纪昆.国防科学技术大学 2016
[10]基于FPGA的聚类算法的加速平台的研究与设计[D]. 贾发慧.中国科学技术大学 2016
本文编号:3277811
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3277811.html