基于张量分解的实时竞价广告响应预测方法

发布时间:2017-12-20 13:41

  本文关键词:基于张量分解的实时竞价广告响应预测方法 出处:《哈尔滨工业大学》2016年博士论文 论文类型:学位论文


  更多相关文章: 实时竞价广告 需求方平台 点击率预测 转化率预测 张量分解 排序优化


【摘要】:迅速崛起的实时竞价广告实现了需求方由“媒体”购买转向“受众”购买,实现了更精准的广告投放,成为数字广告未来发展的大趋势。需求方平台是实时竞价交易系统的核心,为了实现精准广告投放,需求方平台必须具有极高的流量评价、流量选择和自主控制能力,因此需求方平台的技术和算法的难度最大。需求方平台最主要的差别是出价策略,出价直接决定着需求方平台的流量基本单位成本,决定着利润。点击率和转化率预测是直接影响出价质量的重要方面,如何准确地估计点击率和转化率成为实时竞价广告中需要解决的核心问题。本文重点研究实时竞价系统中,面向需求方平台如何提升广告点击率和转化率的预测性能,以提升需求方的投资回报率。需求方进行广告响应预测主要面临着四个方面的严酷挑战。第一,数据的稀疏性太高导致预测结果不可靠;第二,实时竞价过程对点击率和转化率预测算法的时间效率要求高;第三,用户、上下文和广告三者之间的交互作用特别复杂导致预测难度大;第四,训练数据集类别严重不平衡导致预测准确率低。本文基于张量分解模型研究各种挑战的解决策略并寻求有效地综合解决方案。具体来说,本文的主要工作包括以下四个方面:第一,为了解决实时竞价广告响应预测面临的严峻的数据稀疏问题,进行了基于异构信息融合的广告响应预测方法研究。首先尝试从用户生成标签中挖掘新特征来扩展用户特征,然后分析了基于特征的矩阵分解模型集成附加信息的常用策略,面向张量分解模型进行借鉴和改进,针对实时竞价中不同类型异构信息的性质和特点研究了不同的融合策略,提出了基于张量分解模型的异构信息融合综合解决方案和具体实现方法。最后,本文在三个不同的数据集上通过实验对比了在不同级别的特征融合情况下,结果显示我们的融合策略能够较好地提升矩阵分解模型和传统张量分解模型进行广告响应预测的性能。第二,传统的基于Tucker分解和CP分解的模型很难在预测性能和预测时间效率上同时满足实时竞价广告响应预测的需要,为了改进传统张量分解模型的预测时间效率,进行了基于隐语义立方分解模型的广告点击率预测方法的研究。首先深入剖析了隐语义矩阵分解模型与矩阵奇异值分解的内在关系,然后基于高阶奇异值分解是矩阵奇异值分解向高阶张量的扩展的思想,借鉴隐语义矩阵分解模型的建模原理,使用截断的高阶奇异值分解,采用直接在观测数据上建模的方法,提出了隐语义立方分解模型。隐语义立方分解模型具有较少的模型参数,实现简单,训练速度快。本文通过实验分析了隐语义立方分解模型的训练和预测时间效率,并和常用的张量分解模型进行了预测性能对比,实验结果表明隐语义立方分解模型既保证了较低的预测时间复杂度又保证了较好的预测性能。第三,针对用户、上下文和广告之间复杂的交互关系,为了同时获得三者之间全交互作用下的最佳特征表示,进行了基于全交互张量分解模型的点击率预测方法研究。首先分析了两对交互张量分解模型的基本思想,深入剖析了它与传统张量分解模型之间的关系,并分析了它解决广告响应预测问题的局限性。然后,提出了能够克服这种局限性的全交互张量分解模型,这种模型具有全交互关系表示能力,充分挖掘了用户、上下文和广告三者之间复杂的两两全交互关系。最后,通过实验对比了基于异构信息融合的传统张量分解模型、隐语义立方分解模型和全交互张量分解模型的预测性能,实验结果表明本文提出的新模型在保证较低的时间代价情况下取得了最优越的预测性能。第四,为了解决训练样本类别不平衡问题,同时利用点击和转化反馈信息进行了基于三元组排序优化学习的广告响应预测方法的研究。首先将广告响应预测问题形式化为排序问题,将广告展示按照响应类别的正确排序作为优化目标,提出了基于转化、仅点击和未点击的三元组排序优化学习策略。然后分析了三元组排序优化和成对比较排序优化的关系。接着,给出了基于随机梯度下降的三元组排序优化学习算法以及使用该算法实现逻辑回归、矩阵分解和全交互张量分解模型训练的方法。最后通过实验对比和分析了三元组排序优化学习、成对比较优化学习和逐点回归优化学习策略的预测性能。实验结果表明本文提出的基于三元组排序优化学习策略不仅同时提升了点击和转化预测的性能,而且能够有效地解决转化、仅点击和未点击广告展示的三分类排序问题。总之,本文面向需求方平台,基于张量分解模型,针对实时竞价广告中的点击率和转化率预测面临的严峻数据稀疏问题、较高的预测时间效率要求、复杂的三维交互关系以及严重的类别不平衡问题,提出了相应的解决方法和技术方案,有效地提升了广告响应预测性能。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:F713.8;TP391.1

【相似文献】

中国期刊全文数据库 前5条

1 程光 ,龚俭 ,丁伟;网络流量宏观行为分析的一种时序分解模型[J];电子学报;2002年11期

2 谭忠富;变量耦合下大规模规划的三级分解模型及其协调算法[J];系统工程与电子技术;1996年10期

3 凡少强;王国胤;李美争;;改进的知识特征驱动的任务分解模型[J];计算机科学;2014年03期

4 萧蕴诗,汪镭;复杂系统开发中实施策略的时空分解模型及进度规划实例研究[J];信息与控制;2001年01期

5 ;[J];;年期

中国重要会议论文全文数据库 前2条

1 唐爱华;韩志刚;庄淑贞;;淠河灌区水资源优化利用MODP—聚合分解模型[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年

2 马扬;李洪福;白皓;赵立华;马艳;苍大强;;能耗指标分解模型在钢铁厂节能分析中的应用[A];2010全国能源与热工学术年会论文集[C];2010年

中国重要报纸全文数据库 前1条

1 华本城市地产研究院副院长 郑丽平;房企异地扩张的“点线面”战略分解模型[N];中国建设报;2012年

中国博士学位论文全文数据库 前1条

1 单丽莉;基于张量分解的实时竞价广告响应预测方法[D];哈尔滨工业大学;2016年

中国硕士学位论文全文数据库 前2条

1 于静雅;电信运营企业节能定量指标分解模型研究[D];北京邮电大学;2013年

2 谭亚昆;基于DEA的CO_2排放因素分解模型[D];华北电力大学;2012年



本文编号:1312316

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1312316.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户db824***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com