基于多模态深度融合模型的广告点击率预估
发布时间:2021-07-07 07:23
互联网广告效果的研究是网络营销的研究重点,无论是品牌广告或效果广告,合适的互联网广告设计效果将直接影响网络营销商的利益与用户的体验.现阶段,广告运营商的投放策略、广告创意优化、定向人群、媒体选择都以点击率为重要条件,精准的点击率预估可以精细化权衡和保障用户、广告、平台三方利益.为了更加准确的预估点击率本文定向研究用户行为方式,选择马尔科夫链模型处理用户行为信息,利用频繁序列挖掘用户行为特点消除用户间无差异性假设,基于在线学习方法融合特征构建深度神经网络,获得特征的高阶非线性表达,建立多模态深度融合(Multimodal Depth Integration MDI)模型用于点击率预估.实验结果表明,提出的多模态深度融合模型的表示能力和鲁棒性都优于各基线模型,取得不错的预测效果.
【文章来源】:小型微型计算机系统. 2019,40(12)北大核心CSCD
【文章页数】:7 页
【部分图文】:
各个模型AUC
各个模型损失函数
点击率是互联网公司网络流量分配的核心依据,互联网广告平台精确的点击率预估有利于最大化提升三方利益.点击率预估技术从传统的逻辑回归发展到深度学习,其本质是通过设计网络结构进行组合特征的挖掘,也可以描述为一个经典的二分类问题,依据用户侧信息、广告测信息、上下文信息等去建模预测用户是否会点击广告.本文利用经典的深度学习架构MDI模型预估点击率,如图3所示,由梯度提升树(Gradient Boosting Decision Tree GBDT)[8]、因式分解机(Factorization Machines FM)[25]、域因式分解机(Field Factorization M achines FM M)[26]模块组合而成,每一个模块不是独立的,是整个模型共同训练完成.FM模块接受低阶特征信息构造特征交互,GBDT代替传统的人工特征工程方法,可以将低阶特征映射到隐向量空间;FFM模块可以将同类别的特征组合,提出了域(field)的概念,将同类别的特征组合在同一field内便于处理,并通过卷积层(FC)构造高阶特征表达,并利用Prefixspan挖掘出用户的时序信息,更好预估点击率.M DI由多个模块集成,使用GBDT代替连续特征离散化等人工特征工程,具有强的非线性拟合能力以及鲁棒性,利用FM自动学习任意特征的一阶交叉,扩展特征空间,吞吐稀疏特征空间,提高模型的表达能力,通过FFM将同性质特征归于一个域,在实验过程中自动省去零值特征,提高模型训练速度.输入数据为数值特征(dense)和类别特征(sparse)以及序列特征(sequence input),模型将类别特征传至至嵌入层,获取多个嵌入向量,将嵌入向量和数值特征连接传入三层全连接层(Fully Connected layer FC),将第三层全连接层的输出和FFM以及FM的输出连接在一起传入全连接层,结合频繁序列模式挖掘到的信息学习广告是否被点击.
【参考文献】:
期刊论文
[1]在线广告中改进数据分层的动态点击率评估算法[J]. 朱丽辉,谢瑾奎,潘书敏,杨宗源. 小型微型计算机系统. 2015(07)
本文编号:3269206
【文章来源】:小型微型计算机系统. 2019,40(12)北大核心CSCD
【文章页数】:7 页
【部分图文】:
各个模型AUC
各个模型损失函数
点击率是互联网公司网络流量分配的核心依据,互联网广告平台精确的点击率预估有利于最大化提升三方利益.点击率预估技术从传统的逻辑回归发展到深度学习,其本质是通过设计网络结构进行组合特征的挖掘,也可以描述为一个经典的二分类问题,依据用户侧信息、广告测信息、上下文信息等去建模预测用户是否会点击广告.本文利用经典的深度学习架构MDI模型预估点击率,如图3所示,由梯度提升树(Gradient Boosting Decision Tree GBDT)[8]、因式分解机(Factorization Machines FM)[25]、域因式分解机(Field Factorization M achines FM M)[26]模块组合而成,每一个模块不是独立的,是整个模型共同训练完成.FM模块接受低阶特征信息构造特征交互,GBDT代替传统的人工特征工程方法,可以将低阶特征映射到隐向量空间;FFM模块可以将同类别的特征组合,提出了域(field)的概念,将同类别的特征组合在同一field内便于处理,并通过卷积层(FC)构造高阶特征表达,并利用Prefixspan挖掘出用户的时序信息,更好预估点击率.M DI由多个模块集成,使用GBDT代替连续特征离散化等人工特征工程,具有强的非线性拟合能力以及鲁棒性,利用FM自动学习任意特征的一阶交叉,扩展特征空间,吞吐稀疏特征空间,提高模型的表达能力,通过FFM将同性质特征归于一个域,在实验过程中自动省去零值特征,提高模型训练速度.输入数据为数值特征(dense)和类别特征(sparse)以及序列特征(sequence input),模型将类别特征传至至嵌入层,获取多个嵌入向量,将嵌入向量和数值特征连接传入三层全连接层(Fully Connected layer FC),将第三层全连接层的输出和FFM以及FM的输出连接在一起传入全连接层,结合频繁序列模式挖掘到的信息学习广告是否被点击.
【参考文献】:
期刊论文
[1]在线广告中改进数据分层的动态点击率评估算法[J]. 朱丽辉,谢瑾奎,潘书敏,杨宗源. 小型微型计算机系统. 2015(07)
本文编号:3269206
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/3269206.html