搜索广告点击率预测算法研究与实现
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP391.3
【部分图文】:
的广告的链接,最终被用户发现,消费和分散了用户如今互联网中,最稀缺的资源就是用户的注意力,就给广告主等需求方提供一种购买用户注意力(流量)的告抵达用户。在搜索引擎中,用户输入关键词来进了一定比例的流量。广告主买断一些关键词,当用有购买该关键词的广告主进行实时竞价,从而获得的核心关键技术之一就是广告点击率预测,广告点TR)的定义是用户点击该广告的次数 num_click 与用impression 的比值。公式如 2-1 下: 影响着投放广告的顺序,同时也影响着广告的出价策词“手机”时,广告主通过竞价买断了关键词“手机”,主投放的有关“手机”的广告,平台就会按照一定的广告,如图 2-1 所示:
图 3- 1 Sigmoid 函数曲线图数的输出结果是介于(0,1)之间,中间值 c 是 0.5,则出 h(x)代表数据属于某一类别的概率,对于输入 x 率分别为 ( ) ( ), ( ) 中的极大似然估计方法去求损失函数,概率函数如 ( ) ( ( ) ( ( ) 据独立分布,联合分布可表示为各个边际分布的乘积 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函数,由于凸函数的局部最小值等同于全局最小得到 3-6 式:
哈尔滨工业大学工程硕士学位论文Fm 1(x) 为当前的模型,模型通过经验风险极小化来确定下一个弱分类器参数。具体到损失函数本身的选择也就是 L 的选择,有平方损失函数,0-1 损函数,对数损失函数等等。当选择平方损失函数时,这个差值就是残差。GBDT 几乎适用于所有线性和非线性的回归问题,同时也可以设置阈值解二分类问题,应用范围比较广。GBDT 可以给逻辑斯蒂回归模型训练,提高告点击率。如图 3-2 所示,输入样本 x,GBDT 模型得到两颗树 tree1 和 tree2,两棵树个叶子节点都是 LR 模型的一个维度特征,在求和每个叶子权重及时 LR 模型分类结果。
【相似文献】
相关期刊论文 前10条
1 张明红;佘廉;耿波;;基于情景的结构化突发事件相似度研究[J];中国管理科学;2017年01期
2 陈叶斐;张学军;黄卫东;;基于干扰相似度的多话题演化模型[J];电信科学;2017年09期
3 任雪利;代余彪;;软件相似度在成本估算中的应用[J];计算机应用与软件;2015年06期
4 谭明超;刁兴春;曹建军;冯径;;一种基于函数依赖的属性相似度调整算法[J];上海交通大学学报;2015年08期
5 陈立凤;;河马找亲戚[J];学生之友(童花果);2016年12期
6 周娴莉;;十个中文流行语翻译[J];初中生辅导;2016年36期
7 杜碧涵;;母爱[J];少年月刊;2017年05期
8 张呈宇;;热点话题相似度常用算法比较[J];好家长;2017年12期
9 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期
10 詹雪艳;林兆洲;段天璇;李磊;乔延江;;色谱指纹图谱相似度方法的适应性研究[J];中国中医药信息杂志;2012年05期
相关会议论文 前10条
1 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李红莲;潘建军;范京;;音节相似度及其在语音识别中的应用[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 丁维龙;吴水生;陈琦;程志君;;基于树形结构相似度的植物种类识别系统[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
4 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 郭瑛媚;史晓东;陈毅东;高燕;;基于词的话题分布相似度的无监督日文旅游意见词翻译[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三维相似度的活性小分子寻靶平台(英文)[A];中国化学会第30届学术年会摘要集-第二十五分会:化学信息学与化学计量学[C];2016年
8 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
相关重要报纸文章 前10条
1 杨林;住宿按“相似度”分 体现学生视角[N];北京日报;2017年
2 证券时报记者 韩如冰;基金投资相似度趋高[N];证券时报;2006年
3 本报记者 王斌 本报实习生 蒲晓磊;版权局官员:相似度极高的不受保护[N];法制日报;2012年
4 记者 李学梅;研究证实:父亲“偏爱”与自己相像的孩子[N];新华每日电讯;2009年
5 天相投资顾问公司 张新文;风格稳定基金业绩更胜一筹[N];证券时报;2007年
6 记者 刘妮;曾维会见日本新任驻沈总领事[N];沈阳日报;2012年
7 小新;妊娠中毒症与夫妇HLA基因相似度有关[N];中国医药报;2007年
8 海潮;俄研究发现妊娠中毒症疑与夫妇HLA基因相似度有关[N];中国医药报;2007年
9 栾海;妊娠中毒症可能与夫妇 HLA基因相似度有关[N];医药经济报;2007年
10 海纳;“娱乐”模仿的忧虑[N];河北日报;2013年
相关博士学位论文 前10条
1 王玉标;基于动态信任建模的云服务可信性评估与选择研究[D];重庆大学;2018年
2 高欣健;多模态相似度学习方法研究[D];合肥工业大学;2017年
3 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年
4 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年
5 张明西;信息网络中的相似度搜索问题研究[D];复旦大学;2013年
6 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年
7 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年
8 朱笑尘;异质过程数据集成与修复[D];清华大学;2015年
9 贾连印;内存数据库中集合相似度及集合包含问题的研究[D];华南理工大学;2012年
10 崔晓兰;面向在线抱怨自动处理的推荐方法研究[D];华中科技大学;2017年
相关硕士学位论文 前10条
1 吕如州;基于结构元理论的模糊数相似度及应用研究[D];辽宁工程技术大学;2016年
2 夏雨;在线评论中产品特征提取与意见挖掘研究[D];武汉理工大学;2016年
3 方敏;基于节点相似度的线要素匹配方法设计[D];北京建筑大学;2018年
4 张学理;基于多因子标签相似度的标签聚类算法的研究[D];辽宁大学;2018年
5 李凯翔;产科知识图谱的构建与研究[D];郑州大学;2018年
6 李超男;基于节点相似度的社会网络社团发现的算法研究[D];重庆师范大学;2018年
7 花凌锋;面向位置的移动新闻推荐研究[D];安徽理工大学;2018年
8 丁明珠;基于混合相似度指标的社团划分算法研究[D];山东师范大学;2018年
9 杨飞;基于LSTM的文本相似度识别方法研究[D];吉林大学;2018年
10 常明;搜索广告点击率预测算法研究与实现[D];哈尔滨工业大学;2018年
本文编号:2814354
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2814354.html