图片广告点击率预测方法的研究及改进
发布时间:2017-10-08 15:33
本文关键词:图片广告点击率预测方法的研究及改进
更多相关文章: 广告点击率 数据稀疏 图片特征 特征学习 用户属性推断
【摘要】:近年来,随着互联网科技的飞速发展,在线广告逐渐成为各大互联网企业的主要盈利方式。因此针对提升用户对广告满意度,提高广告主利润的研究越来越重要。其中常见的研究围绕利用海量的用户点击日志挖掘用户个性化信息这一方向进行,而研究中最重要的问题是如何提升广告点击率预测结果的精度。目前常见的广告点击率预测方法依赖用户对广告的历史点击数据学习模式进行预测。然而用户对广告的历史点击数据中用户行为数据稀疏以及用户属性缺失的特点,对现有广告点击率预测方法提出了很大的挑战。本课题针对这一挑战,引入了更高效的广告图片特征来改进现有的图片广告点击率预测方法。改进方法的核心思想是通过高效的广告图片特征为新广告找到相应的相似广告,利用相似广告的历史信息提高新广告的点击率预测精度。本课题先分析了现有的图片广告点击率预测方法,以及其中相关技术的的原理。接着对当前图片广告点击率预测方法中广告图片特征提取以及用户属性推断两个环节进行研究。针对这两个环节中,广告图片视觉特征的表示能力有限、任务独立问题和用户属性推断的数据稀疏记录预测精度偏低问题进行改进。为了解决这些问题,本课题利用深度卷积神经网络模型图片特征表示能力强的特点,设计了一种新的广告图片特征学习架构。利用这一架构,本课题从原始广告图片和用户反馈信息中抽取了广告图片高层抽象特征。这种方式相比传统的图片特征提取方式提取的特征更加灵活,适用于点击率预测任务且不需要人工筛选组合特征。通过引入广告图片高层抽象特征,改进了现有的用户属性推断方法。并将广告图片高层抽象特征与点击率预估模型相结合进行预测,缓解了图片广告点击率预测中数据稀疏造成的新广告点击率预测低的问题。本课题的实验使用2014CCF大数据技术创新大赛腾讯公布的大约1G的图片广告点击日志数据。实验结果验证了改进的图片广告点击率预测方法能有效提高新广告记录的点击率预测精度。该改进利用本课题提出的广告图片特征学习架构更好的表示了用户对广告图片的反应,从而实现新广告记录点击率预测结果精度的提高。
【关键词】:广告点击率 数据稀疏 图片特征 特征学习 用户属性推断
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.09
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 绪论9-15
- 1.1 课题研究背景及意义9-10
- 1.2 国内外研究现状及分析10-13
- 1.2.1 国外研究现状10-12
- 1.2.2 国内研究现状12-13
- 1.3 本文主要研究内容13
- 1.4 本文的结构13-15
- 第2章 图片广告特征及相关模型介绍15-26
- 2.1 引言15
- 2.2 图片广告特征的选取15-20
- 2.2.1 常用基础特征16-17
- 2.2.2 图片视觉特征17-18
- 2.2.3 特征选择和特征转换18-20
- 2.3 点击率预测模型的选择20-25
- 2.3.1 朴素贝叶斯模型20-21
- 2.3.2 决策树集成模型21-23
- 2.3.3 因子分解机模型23-25
- 2.4 本章小结25-26
- 第3章 图片广告CTR预测方法与改进研究26-39
- 3.1 引言26
- 3.2 广告图片特征学习方法的改进研究26-34
- 3.2.1 图片视觉特征效果分析26-29
- 3.2.2 传统的图片分类学习架构29-31
- 3.2.3 设计的广告图片特征学习架构31-33
- 3.2.4 改进后广告图片特征学习实验33-34
- 3.3 用户属性推断方法的改进研究34-36
- 3.4 改进方法在模型中的应用36-38
- 3.4.1 聚类算法特征离散化36-37
- 3.4.2 图片特征在模型中的应用37-38
- 3.5 本章小结38-39
- 第4章 改进的图片广告CTR预测方法实验39-52
- 4.1 腾讯广告点击日志数据39-41
- 4.1.1 数据描述39-40
- 4.1.2 数据分析40
- 4.1.3 训练预测数据集生成40-41
- 4.2 模型评价指标41-42
- 4.3 用户属性推断实验设计与分析42-44
- 4.3.1 用户属性的影响分析42-43
- 4.3.2 改进用户属性推断实验分析43-44
- 4.4 贝叶斯模型实验设计及分析44-47
- 4.4.1 改进图片特征提取的效果分析45-46
- 4.4.2 不同聚类数下的效果分析46-47
- 4.5 因子分解机模型实验设计及分析47-51
- 4.5.1 模型参数的影响分析48-49
- 4.5.2 改进图片特征提取的效果分析49-50
- 4.5.3 不同特征聚类数下的影响分析50-51
- 4.6 本章小结51-52
- 结论52-54
- 参考文献54-60
- 致谢60
【参考文献】
中国期刊全文数据库 前4条
1 智颖;;2015全球广告预测报告[J];中国广告;2015年03期
2 施梦圜;顾津吉;;基于平衡采样的轻量级广告点击率预估方法[J];计算机应用研究;2014年01期
3 涂丹丹;舒承椿;余海燕;;基于联合概率矩阵分解的上下文广告推荐算法[J];软件学报;2013年03期
4 刘晓明;田雨;何徽;仲元红;;一种改进的非局部均值图像去噪算法[J];计算机工程;2012年04期
,本文编号:994833
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/994833.html