当前位置:主页 > 文艺论文 > 广告艺术论文 >

搜索广告点击率预测算法研究与实现

发布时间:2020-09-08 15:50
   互联网广告主要分为搜索广告、展示广告等形式,而在这其中,搜索广告是规模最大,增长最快的广告投放方式。搜索广告是依据用户提供的查询关键字对广告进行投放,是最了解用户搜索意图的广告投放形式。搜索广告最关键的技术是广告点击率的预测,广告点击率预测就是预测分析用户行为对投放的广告的点击率,广告点击率关系着广告投放的排序和广告点击收费等因素,因此研究广告点击率对整个搜索广告收入提高有着至关重要的意义。搜索广告利用搜索引擎的技术,分析用户输入的查询意图,提取相应的关键词,根据提取到的关键词,进行语义相关度计算,从广告库中进行索引,给出相应符合用户需求的广告检索结果。当搜索引擎等平台提供的检索排序候选结果中的广告,与用户输入的关键词等相关性越高,用户越感兴趣,点击的行为可能性越高,相应的广告点击率越高,广告收入越高。本文的主要研究和实现内容安排如下:(1)首先对数据集进行清洗和预处理,统计数据信息,提取浅层的特征,并采用常见的机器学习方法进行特征工程。逻辑斯蒂回归模型作为基线方法,将预测的点击率问题作为分类问题,在采用传统机器学习方法中,使用GBDT模型与逻辑斯蒂回归模型融合的方案,对特征组合,进一步深入挖掘影响点击率的因素,提高模型的非线性学习能力。对于数据集中出现的数据稀疏和缺失问题,采用近几年在各种比赛中效果比较好的因子分解机FM算法,与基线方法比较优化结果。(2)搜索广告中的用户查询请求与广告标题之间的相似度对点击率有至关重要的作用,本文首先采用卷积神经网络模型来提取深层次的相似度特征,并将其与人工挖掘到的特征相结合,共同输入到点击率的预测模型中,得到实验结果,实现效果提升。(3)循环神经网络更适合处理序列数据,因此本文也研究了基于循环神经网络的相似度的特征提取。实验分析对比不同类型循环神经网络模型的实验结果,如长短期记忆单元网络,门控循环单元网络,及相应的双向网络形式等,并结合静态注意力和动态注意力机制比较实验结果,提取最好的相似度特征,从而优化最终的点击率预测结果。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP391.3
【部分图文】:

广告,关键词,用户输入,广告主


的广告的链接,最终被用户发现,消费和分散了用户如今互联网中,最稀缺的资源就是用户的注意力,就给广告主等需求方提供一种购买用户注意力(流量)的告抵达用户。在搜索引擎中,用户输入关键词来进了一定比例的流量。广告主买断一些关键词,当用有购买该关键词的广告主进行实时竞价,从而获得的核心关键技术之一就是广告点击率预测,广告点TR)的定义是用户点击该广告的次数 num_click 与用impression 的比值。公式如 2-1 下: 影响着投放广告的顺序,同时也影响着广告的出价策词“手机”时,广告主通过竞价买断了关键词“手机”,主投放的有关“手机”的广告,平台就会按照一定的广告,如图 2-1 所示:

函数曲线图,凸函数,极大似然估计方法,边际分布


图 3- 1 Sigmoid 函数曲线图数的输出结果是介于(0,1)之间,中间值 c 是 0.5,则出 h(x)代表数据属于某一类别的概率,对于输入 x 率分别为 ( ) ( ), ( ) 中的极大似然估计方法去求损失函数,概率函数如 ( ) ( ( ) ( ( ) 据独立分布,联合分布可表示为各个边际分布的乘积 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函数,由于凸函数的局部最小值等同于全局最小得到 3-6 式:

点击率,长尾分布,广告,特征提取


哈尔滨工业大学工程硕士学位论文Fm 1(x) 为当前的模型,模型通过经验风险极小化来确定下一个弱分类器参数。具体到损失函数本身的选择也就是 L 的选择,有平方损失函数,0-1 损函数,对数损失函数等等。当选择平方损失函数时,这个差值就是残差。GBDT 几乎适用于所有线性和非线性的回归问题,同时也可以设置阈值解二分类问题,应用范围比较广。GBDT 可以给逻辑斯蒂回归模型训练,提高告点击率。如图 3-2 所示,输入样本 x,GBDT 模型得到两颗树 tree1 和 tree2,两棵树个叶子节点都是 LR 模型的一个维度特征,在求和每个叶子权重及时 LR 模型分类结果。

【相似文献】

相关期刊论文 前10条

1 张明红;佘廉;耿波;;基于情景的结构化突发事件相似度研究[J];中国管理科学;2017年01期

2 陈叶斐;张学军;黄卫东;;基于干扰相似度的多话题演化模型[J];电信科学;2017年09期

3 任雪利;代余彪;;软件相似度在成本估算中的应用[J];计算机应用与软件;2015年06期

4 谭明超;刁兴春;曹建军;冯径;;一种基于函数依赖的属性相似度调整算法[J];上海交通大学学报;2015年08期

5 陈立凤;;河马找亲戚[J];学生之友(童花果);2016年12期

6 周娴莉;;十个中文流行语翻译[J];初中生辅导;2016年36期

7 杜碧涵;;母爱[J];少年月刊;2017年05期

8 张呈宇;;热点话题相似度常用算法比较[J];好家长;2017年12期

9 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期

10 詹雪艳;林兆洲;段天璇;李磊;乔延江;;色谱指纹图谱相似度方法的适应性研究[J];中国中医药信息杂志;2012年05期

相关会议论文 前10条

1 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 李红莲;潘建军;范京;;音节相似度及其在语音识别中的应用[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

3 丁维龙;吴水生;陈琦;程志君;;基于树形结构相似度的植物种类识别系统[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年

4 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

5 郭瑛媚;史晓东;陈毅东;高燕;;基于词的话题分布相似度的无监督日文旅游意见词翻译[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年

6 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年

7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三维相似度的活性小分子寻靶平台(英文)[A];中国化学会第30届学术年会摘要集-第二十五分会:化学信息学与化学计量学[C];2016年

8 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

9 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

10 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

相关重要报纸文章 前10条

1 杨林;住宿按“相似度”分 体现学生视角[N];北京日报;2017年

2 证券时报记者  韩如冰;基金投资相似度趋高[N];证券时报;2006年

3 本报记者 王斌 本报实习生 蒲晓磊;版权局官员:相似度极高的不受保护[N];法制日报;2012年

4 记者 李学梅;研究证实:父亲“偏爱”与自己相像的孩子[N];新华每日电讯;2009年

5 天相投资顾问公司 张新文;风格稳定基金业绩更胜一筹[N];证券时报;2007年

6 记者 刘妮;曾维会见日本新任驻沈总领事[N];沈阳日报;2012年

7 小新;妊娠中毒症与夫妇HLA基因相似度有关[N];中国医药报;2007年

8 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年

9 栾海;妊娠中毒症可能与夫妇 HLA基因相似度有关[N];医药经济报;2007年

10 海纳;“娱乐”模仿的忧虑[N];河北日报;2013年

相关博士学位论文 前10条

1 王玉标;基于动态信任建模的云服务可信性评估与选择研究[D];重庆大学;2018年

2 高欣健;多模态相似度学习方法研究[D];合肥工业大学;2017年

3 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年

4 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年

5 张明西;信息网络中的相似度搜索问题研究[D];复旦大学;2013年

6 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年

7 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年

8 朱笑尘;异质过程数据集成与修复[D];清华大学;2015年

9 贾连印;内存数据库中集合相似度及集合包含问题的研究[D];华南理工大学;2012年

10 崔晓兰;面向在线抱怨自动处理的推荐方法研究[D];华中科技大学;2017年

相关硕士学位论文 前10条

1 吕如州;基于结构元理论的模糊数相似度及应用研究[D];辽宁工程技术大学;2016年

2 夏雨;在线评论中产品特征提取与意见挖掘研究[D];武汉理工大学;2016年

3 方敏;基于节点相似度的线要素匹配方法设计[D];北京建筑大学;2018年

4 张学理;基于多因子标签相似度的标签聚类算法的研究[D];辽宁大学;2018年

5 李凯翔;产科知识图谱的构建与研究[D];郑州大学;2018年

6 李超男;基于节点相似度的社会网络社团发现的算法研究[D];重庆师范大学;2018年

7 花凌锋;面向位置的移动新闻推荐研究[D];安徽理工大学;2018年

8 丁明珠;基于混合相似度指标的社团划分算法研究[D];山东师范大学;2018年

9 杨飞;基于LSTM的文本相似度识别方法研究[D];吉林大学;2018年

10 常明;搜索广告点击率预测算法研究与实现[D];哈尔滨工业大学;2018年



本文编号:2814354

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2814354.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5f52***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com