当前位置:主页 > 社科论文 > 逻辑论文 >

基于特征优化的逻辑回归模型在广告点击率问题中的应用研究

发布时间:2021-05-23 04:29
  随着信息科技、计算机科技及互联网技术的迅猛发展,互联网广告已经成为互联网变现和收入的主要来源之一。点击率(Click-Through Rate Prediction,CTR)在一定程度上代表了广告的受欢迎程度和被用户观看的次数。因此,当前大部分的广告营收均采用点击付费的方式,广告媒介所获得的收益为单次点击费用率和点击率的乘积。为此,准确地预估广告点击率是非常重要的,是件一举三得的事情。对广告主而言,产品得到了有力推广,增加了潜在用户,能够有效提高创收;对搜索引擎公司而言,更高的广告点击率意味着更多的收入;对用户而言,按照点击率大小排序所呈现的广告正是当下情境中的所需,提升了用户体验,让他们更乐于点击。CTR预估是一件复杂、涉及面广泛的问题。逻辑回归模型(Logistic Regression,LR)作为优良的二分类预测模型,常被运用在点击率的预估问题中。与传统线性模型相比,LR使用了 Logit变换将函数值映射到0~1区间,映射后的函数值就是CTR的预估值。而传统的逻辑回归模型受限于CTR和变量间之间的对数线性关系,训练出来的预估模型有效性往往有待提高。针对这一问题,本文研究比较了几种... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:53 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究状况简介
    1.3 论文的章节安排
第2章 相关方法技术介绍
    2.1 逻辑斯蒂回归模型
        2.1.1 逻辑斯蒂分布
        2.1.2 二项逻辑斯蒂回归模型
    2.2 主成分分析方法
        2.2.1 主成分分析思想原理
        2.2.2 主成分分析数学模型
        2.2.3 主成分分析优缺点
    2.3 决策树
        2.3.1 决策树模型
        2.3.2 决策树学习步骤
        2.3.3 决策树优缺点
    2.4 GBDT算法
        2.4.1 背景知识
        2.4.2 梯度提升树
        2.4.3 GBDT与LR的融合
    2.5 ROC曲线及AUC值
        2.5.1 ROC曲线
        2.5.2 AUC值
        2.5.3 ROC曲线的优点
第3章 传统逻辑回归模型在CTR中的应用
    3.1 数据清洗和样本选取
        3.1.1 数据选择
        3.1.2 无效变量剔除
        3.1.3 字符型变量的处理
        3.1.4 缺失值处理
    3.2 基于传统逻辑回归的建模
        3.2.1 样本集的构成
        3.2.2 初步模型建立
        3.2.3 模型结果
第4章 基于PCA的特征工程
    4.1 确定主成分个数
    4.2 PCA与LR融合模型(一)
        4.2.1 基于碎石图与平行分析的主成分
        4.2.2 基于累积方差贡献率的主成分
    4.3 PCA与LR融合模型(二)
        4.3.1 基于碎石图与平行分析的主成分
        4.3.2 基于累计方差贡献率的主成分
    4.4 模型评价与分析
第5章 基于决策树的特征选择
    5.1 经典决策树
        5.1.1 经典决策树的算法步骤
        5.1.2 基于信息增益的特征选择
    5.2 条件推断树
        5.2.1 条件推断树的算法步骤
        5.2.2 基于条件推断树的特征选择
    5.3 模型评价与分析
第6章 基于GBDT的特征优化
    6.1 GBDT的调参
    6.2 one-hot编码
    6.3 变量重要性
    6.4 GBDT与LR的融合模型
    6.5 模型评价与分析
    6.6 几种方法的对比分析
        6.6.1 流程对比
        6.6.2 变量对比
        6.6.3 模型结果对比
总结与展望
参考文献
致谢


【参考文献】:
期刊论文
[1]广告点击率预估技术综述[J]. 陈巧红,余仕敏,贾宇波.  浙江理工大学学报. 2015(11)
[2]基于特征学习的广告点击率预估技术研究[J]. 张志强,周永,谢晓芹,潘海为.  计算机学报. 2016(04)
[3]基于LDA的互联网广告点击率预测研究[J]. 朱志北,李斌,刘学军,胡平.  计算机应用研究. 2016(04)
[4]基于平衡采样的轻量级广告点击率预估方法[J]. 施梦圜,顾津吉.  计算机应用研究. 2014(01)
[5]广告点击率估算技术综述[J]. 纪文迪,王晓玲,周傲英.  华东师范大学学报(自然科学版). 2013(03)

硕士论文
[1]基于GBDT的社区问题标签推荐技术研究[D]. 孙万龙.哈尔滨工业大学 2015
[2]一种基于逻辑回归模型的搜索广告点击率预估方法的研究[D]. 王兵.浙江大学 2013



本文编号:3202286

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/ljx/3202286.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1d4a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com