当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种基于逻辑回归模型的搜索广告点击率预估方法的研究

发布时间:2018-12-07 08:45
【摘要】:搜索广告是搜索引擎公司如百度,Google等的主要收入来源,当前的收费模式是按用户点击广告的次数收费,而广告位的个数是有限的,因此对于每个用户检索词,怎样在广告库中检索到用户最可能点击的广告返回给前端去展示是所有搜索引擎公司最关心的问题。CTR(Click Through Rate)即是衡量某广告被用户点击的可能性大小的指标。展示CTR最高的广告给用户是三赢的,对于用户,提高了搜索体验,他们乐于点击;对于商家,精准的广告投放策略将使广告都投放给潜在客户,有助于提高他们的营收;对于搜索引擎公司,提高用户点击广告的可能性,将使它们赚取更多广告提成。 预估CTR是一项很复杂、涉及面很广的工作,本文就此问题提出了一种基于逻辑回归模型的预估方法。本文将预估CTR工作分成了两个主要方面:线下训练和线上计算。线下训练中使用Hadoop,从搜索引擎日志出发,经历数据清洗、提取特征、合并增量、排序降维、模型求解、模型验证等步骤,最终得出了一个特征到权重的映射文件,此即为我们的模型。在线上计算部分,经历扩展匹配、广告粗选、CTR计算等步骤,取出了CTR最高的10个广告返回给前端。 逻辑回归模型属于有监督学习的一种,如何提取数据集中区分度高的特征是关键,本文针对CTR预估问题提出了3项一元、二元特征,经实验验证能有效提高搜索引擎收益。针对搜索广告这一特定场景,本文还引入了时间衰减因子用以区分较老的历史记录跟较新的历史记录对CTR预估的不同影响力,也取得了很好的成效。
[Abstract]:Search advertising is the main source of revenue for search engine companies such as Baidu, Google, etc. The current charging model is to charge users according to the number of times they click on advertisements, and the number of ads is limited, so for each user, How to retrieve the advertisements most likely to be clicked by a user in an ad library and return them to the front end to display is the most concerned issue for all search engine companies:. CTR (Click Through Rate) is an indicator to measure the possibility of an advertisement being clicked by a user. Showing that CTR's highest ads are triple wins for users, improving the search experience for users, they are happy to click; for merchants, accurate advertising strategy will enable ads to be delivered to potential customers, helping to increase their revenue; For search engine companies, increasing the likelihood of users clicking on ads will make them earn more ad royalties. Estimating CTR is a complex and extensive work. In this paper, a prediction method based on logical regression model is proposed. In this paper, the prediction CTR work is divided into two main aspects: offline training and on-line computing. In offline training, we use Hadoop, to start from search engine log, go through data cleaning, feature extraction, merge increment, sort dimension reduction, model solution, model verification and so on. Finally, we get a mapping file from feature to weight. This is our model. Online computing part, experienced extended matching, advertising rough selection, CTR calculation and other steps, took out the top 10 CTR ads returned to the front end. Logical regression model is a kind of supervised learning. How to extract the feature of high classification of data set is the key. In this paper, we propose three monadic, binary features for CTR prediction, which can effectively improve the revenue of search engine through experiments. In this paper, the time attenuation factor is introduced to distinguish the different influences of the older historical records and the newer historical records on the CTR estimation for the specific scene of search advertising, and good results have been achieved.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 孙茜云;王上;;浅谈广播广告经营战略[J];山东视听;2003年04期

2 贺雪飞;;文化符号及其象征意义——论广告文化附加值的表现形式[J];现代传播(中国传媒大学学报);2006年05期

3 汪敏;;广告商对新闻传播的影响[J];青年记者;2007年22期

4 邢丽梅;;广告中女性形象定位置疑[J];新闻传播;2008年02期

5 ;《电子产品世界》荣获2008广告主、广告商青睐的中国报刊(B2B类)殊荣[J];电子产品世界;2009年02期

6 汤莉萍;;金融危机下《华尔街日报》的广告突围战[J];传媒;2009年04期

7 汤莉萍;;金融危机下《华尔街日报》的广告突围战[J];中国记者;2009年04期

8 程序;;在验证码里投放广告[J];信息网络;2010年05期

9 邢丽梅;;儿童消费品的电视广告诉求策略[J];新闻爱好者;2011年02期

10 胡春秀;;新闻类期刊广告经营的困惑与出路[J];新闻爱好者;2011年06期

相关会议论文 前10条

1 昝胜锋;朱文雁;;嵌入式广告、文化暗合与电影票房[A];建设经济文化强省:挑战·机遇·对策——山东省社会科学界2009年学术年会文集(4)[C];2009年

2 丁俊楠;赵蔚;;提升用户粘性的移动广告联盟管理研究[A];融合与创新——中国通信学会通信管理委员会第29次学术研讨会论文集[C];2011年

3 刘娜;;教育广告的经济效应分析[A];2009年中国教育经济学学术年会论文集[C];2009年

4 白贵;闪晓宇;;浅析中国近现代回族报刊中的广告[A];中国少数民族地区信息传播与社会发展论丛(2010年刊)[C];2010年

5 安圣慧;陈姜;;网络视频广告应用[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年

6 靳岩钦;张敏;刘奕群;马少平;;搜索引擎用户查询的广告点击意图分析[A];第六届全国信息检索学术会议论文集[C];2010年

7 邓理峰;;广告主导型报刊体制的形成——19世纪美国的工业革命、大众营销与大众化报纸的分化[A];新闻学论集(第20辑)[C];2008年

8 张忠礼;;对《广告法》第38条之我见[A];维护广告市场秩序之我见征文活动获奖论文选编[C];2002年

9 张翠;;美国电视上针对少年儿童的食品和饮品广告:对种族,体型和广告诉求方式的讨论[A];中国传媒大学第五届全国新闻学与传播学博士生学术研讨会论文集[C];2011年

10 朱思群;赵其斌;李玉坤;;期刊面向广告商的营销策略[A];中国编辑学会第十届年会论文集[C];2005年

相关重要报纸文章 前10条

1 本报记者 朱凯;健身媒体形成新格局[N];人民日报海外版;2009年

2 《男人装》主编 瘦马;谁在看你的杂志[N];中国新闻出版报;2005年

3 索蒙;“网赚”——免费掘金进行时[N];财会信报;2006年

4 本报记者 杜思梦;“4+1计划”:“植入广告”新思路[N];中国电影报;2010年

5 林楚馥;从“不买广告商品”说起[N];广东建设报;2006年

6 孙荣欣;效果待考量 监管呈空白[N];中国文化报;2010年

7 实习记者 马行超;揭开乐视网的神秘面纱[N];中国知识产权报;2010年

8 本报见习记者 袁舒婕;《中国国家地理》:新媒体和纸媒齐头并进[N];中国新闻出版报;2011年

9 ;艾德思奇 IT改变万亿美元广告市场格局[N];中国计算机报;2011年

10 Andrew Wallenstein 翻译 杨一晨;ABC向广告商做出让步[N];中国电影报;2006年

相关博士学位论文 前10条

1 杨海军;广告舆论传播研究[D];复旦大学;2011年

2 杜积西;1978-2008:广告审美意识的流变[D];西南大学;2012年

3 于林洋;广告荐证的法律规制研究[D];西南政法大学;2011年

4 许敏玉;商业视域下广告审美研究[D];吉林大学;2013年

5 彭茗玮;社会信息学视域下广告隐喻的认知解释[D];浙江大学;2012年

6 刘心;中国音视频形态广告监管中的政府作用[D];中国政法大学;2013年

7 孙绍君;百年中国品牌视觉形象设计研究[D];苏州大学;2013年

8 张妍妍;美国的商业言论自由[D];山东大学;2012年

9 黄飞珏;中国大陆生活类周报刊发展研究[D];华东师范大学;2010年

10 陈李钢;基于赞助搜索的关键字广告最优策略研究[D];哈尔滨工业大学;2011年

相关硕士学位论文 前10条

1 纪佳婧;SNS广告传播研究[D];河北大学;2010年

2 钟华;证言广告研究[D];山东大学;2010年

3 童强;搜索引擎关键字广告点击率与保留价研究[D];大连理工大学;2011年

4 文军;后现代消费文化语境下广告的困境与出路[D];兰州大学;2011年

5 郑荃文;广告语言的美学效果对受众广告审美趋向的影响[D];四川师范大学;2010年

6 刘轶男;吉林电视台广告产品营销策略的优化方案[D];吉林大学;2010年

7 温小勤;酒类广告中的口部和手部动性词语研究[D];广州大学;2010年

8 蒋琛;蜕变—杂志广告的创意途径[D];湖北工业大学;2011年

9 张璐;广告中模糊语对消费行为的提升模式[D];曲阜师范大学;2011年

10 谢磊;品牌符号化现象研究[D];西南政法大学;2010年



本文编号:2366929

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2366929.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fe88e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com