基于分布式逻辑回归模型的广告点击率预估系统
发布时间:2021-11-02 21:33
一直以来,广告都是互联网公司一个非常重要的收入来源,像国外的谷歌、雅虎,国内的百度、微博等,这些走在互联网领域的领头羊,都是以广告为主要收入。尤其是在机器学习、人工智能的驱动下,越来越多的公司投入到如何提高广告变现能力的研究当中。与传统的广告相比,移动广告用户所处的环境更加复杂,所以需要更准确的投放技术。因此,研究如何从时刻都在变化的流量中,实时地从平台的广告库中选取合适的广告,精准投放给用户是一个巨大的挑战。本文正是基于这样一个复杂环境,考虑如何设计并实现一个能对候选广告库中的每个候选广告都尽可能计算出准确点击率的系统。广告点击率(Click-Through-Rate,CTR)系统需要合理使用用户的基本信息和浏览记录,预估出广告被用户点击的可能性大小。从而结合广告点击率和竞价因子对广告排序,选取最靠前的N个广告投送给用户,这就是系统所要完成的主要工作。以广告点击率的预估值为依据,对候选广告排序,从用户的角度,用户看到自己感兴趣广告的可能性更高了;从广告主的角度,广告能达到更好的传播效果;从平台的的角度,平台用户留存率提高,平台效益自然会更好。为了达到这三者的利益最大化,作者基于分布式...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2-1?Sigmoid函数曲线??Figure?2-1?Sigmoid?Fuction?Curve??
TensorFlow是时下比较流行的一个机器学习框架,在大数据计算,深度学习??方面都有着很好的性能和优势。作者将基于TensorFlow,实现分布式的逻辑回归??模型。TensorFlow中的分布式机器学习训练使用了如图2-2所示的参数服务器架??构[25】。??Parameter?Server?W?—?W???TJ^W??rp'1'1""'1"1*-%?'''''"'"-v?>■'????<■■■■'.-"N?A—??I??my?麵mmmmJ?V—■■■?_?■■■^?VwarntJ???V?V.,,,,??w/h?11?\\??Model??Jl???Jl???Jl???Replicas?|[??Shids?6?6?6??图2-2?TensorFlow分布式架构??Figure?2-2?Distributed?Architecture?of?TensorFlow??当模型越来越大,模型的参数越来越多,一台机器的性能己经无法满模型参??数的更新时,会需要把参数分开放到不同的机器去存储和更新。正是基于这点考??虑,在工业中,逐渐萌芽出了参数服务器的概念。参数服务器可以是由多台服务??器组成的集群,类似分布式的存储架构,涉及到数据的同步,信息的交换,一致??性等,一般仍是以<key,value>的形式,可以简单将其理解为一个分布式的<1^丫,??value>内存数据库,加上一些参数更新的操作。在性能需求较高时,几百亿的参??数被分散到不同的机器上去保存和更新
一同步致据并行Figure2-3SynchronousDataParallelism
【参考文献】:
期刊论文
[1]基于云计算的大数据信息检索技术[J]. 万冬娥. 电子技术与软件工程. 2018(03)
[2]计及用电模式的居民负荷梯度提升树分类识别方法[J]. 王守相,刘天宇. 电力系统及其自动化学报. 2017(09)
[3]一种基于矩阵的并行CRC校验算法[J]. 赵坤鹏,吴龙胜,马徐瀚,陈庆宇. 电子设计工程. 2017(03)
[4]基于核函数的非线性支持向量机[J]. 张立,王渊民. 科技展望. 2017(01)
[5]基于AUC的分类器评价和设计综述[J]. 汪云云,陈松灿. 模式识别与人工智能. 2011(01)
[6]极大似然估计方法介绍[J]. 赵军圣,庄光明,王增桂. 长春理工大学学报. 2010(06)
[7]一种面向大规模特征集的高效特征匹配算法[J]. 张伟,薛一波,周宗伟,汪东升. 高技术通讯. 2009(06)
[8]一种PCA算法及其应用[J]. 张媛,张燕平. 微机发展. 2005(02)
硕士论文
[1]基于逻辑回归模型的广告点击率预估系统的设计与实现[D]. 董书超.哈尔滨工业大学 2016
[2]MapReduce作业组合系统的研究与实现[D]. 朱晨杰.上海交通大学 2013
本文编号:3472410
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2-1?Sigmoid函数曲线??Figure?2-1?Sigmoid?Fuction?Curve??
TensorFlow是时下比较流行的一个机器学习框架,在大数据计算,深度学习??方面都有着很好的性能和优势。作者将基于TensorFlow,实现分布式的逻辑回归??模型。TensorFlow中的分布式机器学习训练使用了如图2-2所示的参数服务器架??构[25】。??Parameter?Server?W?—?W???TJ^W??rp'1'1""'1"1*-%?'''''"'"-v?>■'????<■■■■'.-"N?A—??I??my?麵mmmmJ?V—■■■?_?■■■^?VwarntJ???V?V.,,,,??w/h?11?\\??Model??Jl???Jl???Jl???Replicas?|[??Shids?6?6?6??图2-2?TensorFlow分布式架构??Figure?2-2?Distributed?Architecture?of?TensorFlow??当模型越来越大,模型的参数越来越多,一台机器的性能己经无法满模型参??数的更新时,会需要把参数分开放到不同的机器去存储和更新。正是基于这点考??虑,在工业中,逐渐萌芽出了参数服务器的概念。参数服务器可以是由多台服务??器组成的集群,类似分布式的存储架构,涉及到数据的同步,信息的交换,一致??性等,一般仍是以<key,value>的形式,可以简单将其理解为一个分布式的<1^丫,??value>内存数据库,加上一些参数更新的操作。在性能需求较高时,几百亿的参??数被分散到不同的机器上去保存和更新
一同步致据并行Figure2-3SynchronousDataParallelism
【参考文献】:
期刊论文
[1]基于云计算的大数据信息检索技术[J]. 万冬娥. 电子技术与软件工程. 2018(03)
[2]计及用电模式的居民负荷梯度提升树分类识别方法[J]. 王守相,刘天宇. 电力系统及其自动化学报. 2017(09)
[3]一种基于矩阵的并行CRC校验算法[J]. 赵坤鹏,吴龙胜,马徐瀚,陈庆宇. 电子设计工程. 2017(03)
[4]基于核函数的非线性支持向量机[J]. 张立,王渊民. 科技展望. 2017(01)
[5]基于AUC的分类器评价和设计综述[J]. 汪云云,陈松灿. 模式识别与人工智能. 2011(01)
[6]极大似然估计方法介绍[J]. 赵军圣,庄光明,王增桂. 长春理工大学学报. 2010(06)
[7]一种面向大规模特征集的高效特征匹配算法[J]. 张伟,薛一波,周宗伟,汪东升. 高技术通讯. 2009(06)
[8]一种PCA算法及其应用[J]. 张媛,张燕平. 微机发展. 2005(02)
硕士论文
[1]基于逻辑回归模型的广告点击率预估系统的设计与实现[D]. 董书超.哈尔滨工业大学 2016
[2]MapReduce作业组合系统的研究与实现[D]. 朱晨杰.上海交通大学 2013
本文编号:3472410
本文链接:https://www.wllwen.com/shekelunwen/ljx/3472410.html