基于逻辑回归的在线广告CTR优化和预测
本文关键词:基于逻辑回归的在线广告CTR优化和预测,,由笔耕文化传播整理发布。
【摘要】:点击率(CTR)预测是互联网公司中重要的研究课题,其结果与上下文、用户属性和广告属性息息相关,CTR的有效预测对于提高其公司的收入至关重要。CTR预估中最常见的模型是逻辑回归(LR),然而LR实质上属于广义线性模型。对于计算广告而言,特征变量不仅多,而且特征与特征之间存在关联。一方面,实际业务需要快速有效的筛选特征并进行特征组合,这在很大程度上只能依靠人工经验,耗时耗力同时并不一定会带来效果的提升。另一方面,广告数据是实时产生的,批量的处理会面临时效性等问题,在线计算就显得尤为重要。本文在对传统LR模型的相关原理和参数优化算法介绍的基础上,抽离出用户特征和广告特征,并用XTAS(XTAV)T表示用户与广告之间的关联,将其添加到sigmoid函数中得到新的LR模型。和以往求解方法不同的是,本文采用在线最优化算法FTRL提高参数计算效率,采用混合正则化来防止训练过拟合。在实验部分,我们主要考虑AUC和log-loss两种评估指标,根据之前的模型和算法,最后从准确性、参数敏感性和可靠性分析并得出结论。本文的主要成果体现在三个方面。第一,本文考虑了用户与广告的特征关联,且根据关联矩阵的稀疏性和大规模等特点将其分解,从而使得其比传统的LR模型有着更强的非线性拟合能力。第二,本文的模型能自动消除无用的特征,使得在线预测更加迅速,尤其对于大规模稀疏性数据和特征。第三,利用FTRL在线算法,能实时处理数据,效率高且避免了批量处理。
【关键词】:点击率预估 逻辑回归 特征关联 FTRL 混合正则化
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F713.8
【目录】:
- 摘要3-4
- Abstract4-6
- 第1章 引言6-10
- 1.1 研究背景6-7
- 1.2 相关内容研究进展7-9
- 1.2.1 CTR预估的主要模型7
- 1.2.2 最优化算法7-8
- 1.2.3 正则化8-9
- 1.3 研究思路和主要内容9-10
- 第2章 逻辑回归的求解方法10-23
- 2.1 逻辑回归作为分类问题的一般表述10-11
- 2.2 逻辑回归作为二分类问题的依据11-13
- 2.3 为什么一定是sigmoid函数13-14
- 2.4 为什么用对数损失函数14-15
- 2.5 梯度下降法15-17
- 2.6 拟牛顿法17-18
- 2.7 带正则项的处理18-23
- 第3章 基于FTRL算法对传统逻辑回归的优化23-37
- 3.1 CTR预估的技术和优化算法23-24
- 3.2 关联特征的引入和求解24-27
- 3.3 在线最优化算法的比较27-30
- 3.4 基于FTRL在线算法的求解30-33
- 3.4.1 算法设计与流程30-31
- 3.4.2 细节讨论与说明31-33
- 3.5 相关性质和推导33-37
- 第4章 实验结果与分析37-42
- 4.1 实验数据和设计37-38
- 4.2 广告点击率的评估指标38-39
- 4.3 广告点击率估计的结果分析39-41
- 4.4 结论41-42
- 参考文献42-44
- 致谢44
【相似文献】
中国期刊全文数据库 前10条
1 周春平;;收入、收入满意度对居民主观幸福感影响实证研究——来自江苏的证据[J];南京航空航天大学学报(社会科学版);2013年01期
2 刘遵雄;黄志强;郑淑娟;张恒;;基于内点法的稀疏逻辑回归财务预警模型[J];计算机工程与设计;2013年06期
3 ;《信用风险评分卡研究》[J];银行家;2014年02期
4 张秀兰;;逻辑回归模型下的企业财务预警实证研究[J];求索;2012年01期
5 刘遵雄;黄志强;孙清;张恒;;SCAD惩罚逻辑回归的财务预警模型[J];统计与信息论坛;2012年12期
6 邢秋菊,赵纯勇,高克昌,郭跃;基于GIS的滑坡危险性逻辑回归评价研究[J];地理与地理信息科学;2004年03期
7 林辰乐;吕翔涛;;影响城市低保受助者就业的政策因素分析——就业的双项逻辑回归模型及访谈实证研究[J];中国软科学;2012年08期
8 李霞;;基于逻辑回归的电子企业员工工作满意度研究[J];郑州航空工业管理学院学报;2010年01期
9 田永峰;王仕军;;让经济逻辑回归文化自觉——亚当·斯密理论体系中两条主线关系的辨正[J];湖北经济学院学报;2012年01期
10 赵路明;;ST公司有效利用盈余管理的实证研究[J];黑龙江科技信息;2007年02期
中国博士学位论文全文数据库 前1条
1 张道军;逻辑回归空间加权技术及其在矿产资源信息综合中的应用[D];中国地质大学;2015年
中国硕士学位论文全文数据库 前10条
1 粟武林;一种基于逻辑回归的微博用户可信度评估方法[D];河北大学;2015年
2 胡俊;基于多元逻辑回归和邻域信息的高光谱遥感影像半监督分类[D];中国矿业大学;2015年
3 伊瑶瑶;基于Hadoop的数据挖掘技术研究[D];南京邮电大学;2015年
4 张晓旭;基于复杂网络理论的厄尔尼诺分析与预测[D];中国海洋大学;2015年
5 乔宁;多元逻辑回归在实时竞价中的应用研究[D];河北工业大学;2015年
6 李雁林;小样本低质量数据下贷款需求分类模型研究[D];吉林大学;2016年
7 代成雷;基于逻辑回归的在线广告CTR优化和预测[D];浙江大学;2016年
8 董纯洁;基于实例与逻辑回归的多标签分类模型[D];南京大学;2013年
9 祁全昌;基于内容广告平台的点击率预估系统的设计与实现[D];南京大学;2012年
10 刘力银;基于逻辑回归的推荐技术研究及应用[D];电子科技大学;2013年
本文关键词:基于逻辑回归的在线广告CTR优化和预测,由笔耕文化传播整理发布。
本文编号:288743
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/288743.html