广告推荐系统的硬件优化设计与实现
发布时间:2020-12-09 06:38
新型互联网广告通过建立网络用户与广告之间的信息关系,利用智能化广告推荐技术匹配用户潜在感兴趣的广告定向投放。目前智能化广告推荐系统以传统的软件CPU实现方式为主,但是随着数据量的增加,由于CPU的计算性能不足,软件CPU的实现方式存在用户响应时间长和吞吐量低的问题。针对本文研究的广告推荐系统,综合分析并且选择基于FPGA的硬件加速方案提升广告推荐系统的计算性能。本文概述了广告推荐系统模型并且分析了FM和FFM算法优缺点,设计了基于FFM和DNN的混合推荐算法。为了解决广告推荐系统的服务器CPU计算性能不足,本文做了四方面工作:第一,充分利用本文研究的推荐算法的重复计算和FPGA的并行计算能力设计了基于FPGA的广告推荐系统的硬件加速架构。第二,本文通过设计了基于URAM的数据分片的方案优化了FPGA计算时的数据传输时耗。第三,本文通过可重构计算、分布式并行计算和DSP资源复用的优化设计方案提高了FPGA的并行计算能力。第四,本文提出了基于LSM的分段多项式算法和分段线性查找表和EC-CORDIC算法拟合激活函数,提高了传统拟合方法的精度,减少了FPGA逻辑资源使用。最后本文搭建了广告推...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:94 页
【学位级别】:硕士
【部分图文】:
广告推荐系统模型
图 3-2服务器CPUCPUCPUCPUDDRFPGA计算DDRPCIE=4, =10, =18 损失函数变化可以发现,FFM 算法隐向量的维度 对算法的性能后性能评估参数 AUC 如表 3-1 所示。表 3-1 =4, =10, =18 AUC 值对比 4 维 10 维 值 0.7479 0.7606 值 0.7237 0.7326 节采用 AdaGrad 优化器的迭代算法以及 FFM 算法的 值,本仿真测试的参数 =80, =18,在迭代过程法的损失函数对比曲线如图 3-3。
24图 3-3 FM 和 FFM 算法的损失值从图 3-3 中可以发现,刚开始迭代损失函数下降很快,越到后面下降的越慢,说明经过了 100 次迭代已经收敛理论极限值。而且可以看出 FFM 算法的迭代的损失函数极限值是小于 FM 算法的,所以 FFM 算法的性能是优于 FM 算法的。AdaGrad 优化器对应的 AUC 指标如表 3-2。表 3-2 AUC 值数据集 FM 算法 FFM 算法 DNN+FMM 算法训练 AUC 值 0.7457 0.7780 0.7902测试 AUC 值 0.7248 0.7380 0.7633从上表中的测试结果可以看出,不管是训练数据集还是线上测试数据集基于FFM 和 DNN 混合推荐算法 AUC 值都优于 FM 算法和 FFM 算法,而且 FFM 算法的性能是优于 FM 算法的,所以说明本文研究推荐系统使用基于 FFM 和 DNN 混合推荐算法时可行的。3.2 广告推荐系统的硬件架构设计第二章分析了 CPU/GPU/FPGA/ASIC 的性能,选择 FPGA 作为本文研究的广告推荐系统的硬件加速方案,所以需要在广告推荐系统利用 FPGA 的并行计算能力和低延时的特性设计加速系统架构
本文编号:2906456
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:94 页
【学位级别】:硕士
【部分图文】:
广告推荐系统模型
图 3-2服务器CPUCPUCPUCPUDDRFPGA计算DDRPCIE=4, =10, =18 损失函数变化可以发现,FFM 算法隐向量的维度 对算法的性能后性能评估参数 AUC 如表 3-1 所示。表 3-1 =4, =10, =18 AUC 值对比 4 维 10 维 值 0.7479 0.7606 值 0.7237 0.7326 节采用 AdaGrad 优化器的迭代算法以及 FFM 算法的 值,本仿真测试的参数 =80, =18,在迭代过程法的损失函数对比曲线如图 3-3。
24图 3-3 FM 和 FFM 算法的损失值从图 3-3 中可以发现,刚开始迭代损失函数下降很快,越到后面下降的越慢,说明经过了 100 次迭代已经收敛理论极限值。而且可以看出 FFM 算法的迭代的损失函数极限值是小于 FM 算法的,所以 FFM 算法的性能是优于 FM 算法的。AdaGrad 优化器对应的 AUC 指标如表 3-2。表 3-2 AUC 值数据集 FM 算法 FFM 算法 DNN+FMM 算法训练 AUC 值 0.7457 0.7780 0.7902测试 AUC 值 0.7248 0.7380 0.7633从上表中的测试结果可以看出,不管是训练数据集还是线上测试数据集基于FFM 和 DNN 混合推荐算法 AUC 值都优于 FM 算法和 FFM 算法,而且 FFM 算法的性能是优于 FM 算法的,所以说明本文研究推荐系统使用基于 FFM 和 DNN 混合推荐算法时可行的。3.2 广告推荐系统的硬件架构设计第二章分析了 CPU/GPU/FPGA/ASIC 的性能,选择 FPGA 作为本文研究的广告推荐系统的硬件加速方案,所以需要在广告推荐系统利用 FPGA 的并行计算能力和低延时的特性设计加速系统架构
本文编号:2906456
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2906456.html