广告定向中基于潜在语义的用户分组方法
发布时间:2017-05-17 06:12
本文关键词:广告定向中基于潜在语义的用户分组方法,由笔耕文化传播整理发布。
【摘要】:互联网的普及极大推动了在线广告活动的发展。与传统媒体广告相比,在线广告有非常丰富的信息资源,并且可以通过定向技术实现广告的精准投放。这些丰富的信息资源不仅包括用户的姓名、年龄、地域等静态属性,也包括用户的在线查找、广告点击等动态行为信息。对于大多数比较受欢迎的网站,活动用户的数量是非常庞大的,如果针对单个用户逐一投放广告,往往会给系统带来较大的负担。而用户分组正是减轻这一负担的一种有效方式。 用户分组把相似的用户分在同一个组中,然后对用户组内的用户投放相关广告。对于行为定向技术,用户分组从用户的动态行为信息中挖掘用户的兴趣,这样,一个用户组就代表了一种潜在的兴趣。针对用户组投放与该兴趣相关的广告后,用户组内的用户会有较大的概率去点击广告,进而产生购买等转换行为,给广告主带来更大的收益。现有的用户分组方法存在两个比较大的挑战。 1.基于无监督聚类算法(例如K-means算法)的用户分组方法没有考虑用户属性之间的语义关系,并且只允许一个用户属于一个用户组。但是在实际情况中,用户的一系列行为属性之间存在潜在的语义关联,一个用户可能同时会产生多个不同的兴趣。如果考虑数据间的潜在语义,并且允许一个用户分在多个用户组中,能够更加精准地表达用户的兴趣或购买意图。 2.基于潜在语义算法(例如PLSA或LDA)的用户分组方法能够考虑到用户数据之间的关联,也允许一个用户同时属于多个用户组中。但是这种方法把用户看作数据实例,即使潜在的语义是被嵌入在经过转换后的数据中的,聚类算法也仍然间接地对用户进行聚类。而且现有的分组方法只从用户的在线查询行为中挖掘其兴趣,忽略了广告和用户兴趣之间的关系。 针对以上问题,本文提出一种基于LDA的用户分组方法。与现有的基于LDA的用户分组方法不同,首先,本文不仅考虑用户的单个查询行为信息,而且将用户发出的查询和点击过的广告结合起来,更加精准地描述用户的在线行为。其次,本文的数据实例采用用户发出的查询和点击过的广告,把与之相关联的用户作为属性,能够直接得到用户分组结果。本文的主要贡献包括以下几个部分: 1.给出了用户分组问题的形式化定义。现有的基于潜在语义的用户分组方法只采用用户发出的查询数据对用户进行分组,本文首次引入用户点击过的广告,提出一种更加精确的描述用户在线行为特征的观点。通过分析用户发出的查询和点击过的广告与用户的兴趣之间的关系,结合用户发出的查询和用户点击过的广告共同刻画用户画像,并在此基础上给出用户分组的形式化定义。此外,本文从曝光和点击的角度出发,关注用户分组之后用户组的质量对广告投放带来的影响,定义用户分组结果优化的问题。 2.提出了一种基于LDA的用户分组方法。现有的基于潜在语义的用户分组方法将用户发出的查询作为特征向量代表用户,对用户进行间接聚类。本文分析比较LSA、PLSA和LDA三种能够用于潜在语义分组的聚类方法,LSA算法的结果只能从数学的角度解释,PLSA算法参数空间的大小随着训练集的增大而增大,因此本文基于LDA算法对用户进行分组。与现有的方法不同,本文将用户发出的查询,用户点击过的广告组合作为数据实例,与之相关的用户作为属性,运用到LDA算法中,直接获取分好的用户组。 3.设计了三种用户分组结果优化方法。现有的用户分组相关研究没有涉及对用户分组之后的结果进行后续优化的工作。本文提出三种方法来优化用户组的质量。第一种用户组合并法主要针对小用户组现象,在保证CTR值的同时补充用户以满足曝光量;第二种固定阈值法主要针对用户组中低成员概率的问题,为所有的用户组定义一个固定阈值来移除不满足阈值的用户,以得到点击率(Click-through Rate, CTR)提高值更大的用户组,但这种策略可能会引起小用户组现象;第三种动态阈值法基于前两种策略,根据各个用户组中的用户分布动态分配阈值,同时保证了高曝光和高CTR。 本文提出一种基于LDA的用户分组方法,并对分组后的用户组质量进行优化,在真实的数据集上对用户分组方法和用户分组结果优化方法进行了全面的实验。多组实验结果表明,比起现有的用户分组方法,文章提出的基于LDA的用户分组方法使用简单的查询和点击信息就能够在新广告上获得更高的CTR值,针对用户分组结果的优化方法能够得到更高质量的用户组。
【关键词】:在线广告 行为定向 用户分组 LDA 点击率
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:F713.8;TP391.1
【目录】:
- 摘要6-8
- ABSTRACT8-12
- 第一章 绪论12-22
- 1.1 研究背景12-15
- 1.2 研究内容15-19
- 1.2.1 在线广告投放15-16
- 1.2.2 广告定向中行为定向技术16-17
- 1.2.3 行为定向中用户分组方法17-19
- 1.2.4 用户分组结果优化19
- 1.3 本文贡献19-21
- 1.4 文章结构21-22
- 第二章 国内外研究现状22-27
- 2.1 在线广告中CTR预测的研究现状22-23
- 2.2 广告定向中行为定向技术的研究现状23-24
- 2.3 行为定向中用户分组方法的研究现状24-26
- 2.3.1 用户画像生成方法对比24
- 2.3.2 用户分组方法对比24-26
- 2.4 本章小结26-27
- 第三章 问题定义27-35
- 3.1 用户分组问题定义27-32
- 3.1.1 用户画像27-29
- 3.1.2 基于用户画像的用户分组29-30
- 3.1.3 用户分组目标30-32
- 3.2 用户分组结果优化问题定义32-34
- 3.2.1 基于曝光量的用户分组结果优化33
- 3.2.2 基于CTR的用户分组结果优化33-34
- 3.3 本章小结34-35
- 第四章 用户分组方法35-50
- 4.1 基于LDA的用户分组方法35-37
- 4.2 用户分组方法在已有广告上的有效性验证37-47
- 4.2.1 实验数据集38-40
- 4.2.2 CTR提高40-43
- 4.2.3 小用户组占比43-45
- 4.2.4 F-Measure值45-47
- 4.3 用户分组方法在新广告上的有效性验证47-49
- 4.4 本章小结49-50
- 第五章 用户分组结果优化方法50-60
- 5.1 面向小用户组现象的用户组优化50-52
- 5.2 面向低成员概率的用户组优化52-55
- 5.3 兼顾小用户组和低成员概率的用户组优化55-58
- 5.4 本章小结58-60
- 第六章 总结与展望60-62
- 6.1 本文工作60
- 6.2 未来展望60-62
- 参考文献62-68
- 致谢68-69
- 攻读硕士学位期间发表论文和科研情况69
【参考文献】
中国期刊全文数据库 前2条
1 宋浩远;;基于模型的聚类方法研究[J];重庆科技学院学报(自然科学版);2008年03期
2 周傲英;周敏奇;宫学庆;;计算广告:以数据为核心的Web综合应用[J];计算机学报;2011年10期
本文关键词:广告定向中基于潜在语义的用户分组方法,由笔耕文化传播整理发布。
,本文编号:372689
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/372689.html