电商搜索广告中语义理解和广告排序方法研究
发布时间:2021-10-12 12:31
电商搜索广告中的查询语义理解和广告排序问题一直都是学术界和工业界研究的热点,两者是相互依存的关系,排序是最终目的,而只有做好查询短语的语义理解才能实现精准广告排序,两者缺一不可。其中语义理解的关键技术有查询意图预测和查询语义扩展,而排序过程涉及到广告相关性计算和广告点击率预估。语义理解的精度直接影响到返回给用户的广告质量和广告排序的精度,而传统的基于概率的方法虽能一定程度上理解用户的查询语义,但是不够精细。本文的语义理解方法通过提取强有力的特征来描述用户的查询,其中通过引入MCI(mutual click intent)来描述两个查询项之间的关联度,通过改进的PageRank算法来计算查询项的贡献度,进而提取出与关联度、贡献度相关的特征,再将提取出的两类特征应用进分类器中,实现精准预测用户查询意图。另外,针对贡献度求解模型中查询有向图可能存在无用有向边干扰算法迭代的问题,采用“剪枝”操作去除掉查询有向图中的无用有向边,提升贡献度值求解的精度,并最终提升查询意图预测分类器的性能。同时为了检索出更多相关的广告,方法基于Word2Vec模型做了查询的语义扩展。随后,我们设计了一系列实验来证明...
【文章来源】:西南交通大学四川省 211工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 语义理解
1.2.2 广告排序
1.3 论文研究内容
1.4 论文组织结构
第2章 语义理解和广告排序的研究方法
2.1 预备知识
2.1.1 PageRank算法
2.1.2 Word2Vec模型
2.1.3 TF-IDF算法
2.1.4 GBDT模型
2.2 查询短语的语义理解
2.2.1 问题定义
2.2.2 研究思路概述
2.3 多查询下的广告排序实现
2.3.1 问题定义
2.3.2 研究思路概述
2.4 本章小结
第3章 融入查询短语潜在信息的语义理解方法
3.1 基于概率的语义理解方法
3.2 本文的语义理解方法线上线下的工作过程
3.3 基于查询短语潜在信息的查询意图预测
3.3.1 特征描述
3.3.2 特征提取与计算
3.3.3 预测流程
3.3.4 案例分析
3.4 基于Word2Vec的查询语义扩展
3.4.1 训练语料库中短语的提取
3.4.2 扩展流程
3.4.3 案例说明
3.5 本章小结
第4章 广告排序的方法研究
4.1 本文的广告排序方法线上线下的工作过程
4.2 基于贡献度求解模型和标准TF-IDF模型的广告相关性计算
4.2.1 两种常见广告相关性计算方法
4.2.2 融入贡献度求解模型的广告相关性计算
4.3 基于GBDT模型的广告点击率预估
4.4 多查询条件下广告排序的解决方案
4.5 本章小结
第5章 实验分析
5.1 实验相关数据
5.2 评测方法
5.2.1 语义理解评测方法
5.2.2 广告排序评测方法
5.3 实验环境及系统整体结构
5.4 语义理解方法的实验结果及结果分析
5.5 多查询下广告排序方法的实验结果及结果分析
5.6 本章小结
总结与展望
工作总结
工作展望
致谢
参考文献
攻读硕士学位期间发表的论文及参与的科研项目
【参考文献】:
期刊论文
[1]基于N-Gram的计算机病毒特征码自动提取的改进方法[J]. 杨燕,蒋国平. 计算机科学. 2017(S2)
[2]基于连续Skip-gram及深度学习的图像描述方法[J]. 曹刘彬,张丽红. 测试技术学报. 2017(05)
[3]基于特征学习的广告点击率预估技术研究[J]. 张志强,周永,谢晓芹,潘海为. 计算机学报. 2016(04)
[4]Word2vec的核心架构及其应用[J]. 熊富林,邓怡豪,唐晓晟. 南京师范大学学报(工程技术版). 2015(01)
[5]基于网页链接与用户反馈的PageRank算法改进研究[J]. 曹姗姗,王冲. 计算机科学. 2014(12)
[6]一种无位置偏见的广告协同推荐算法[J]. 霍晓骏,贺樑,杨燕. 计算机工程. 2014(12)
[7]基于PageRank的有向加权复杂网络节点重要性评估方法[J]. 张琨,李配配,朱保平,胡满玉. 南京航空航天大学学报. 2013(03)
[8]搜索引擎广告用户行为预测与特征分析[J]. 王海雷,贺一骏,俞学宁,张铭. 计算机应用研究. 2013(05)
[9]利用查询重构识别查询意图[J]. 张晓娟,陆伟. 现代图书情报技术. 2013(01)
[10]基于语义理解的智能搜索引擎的研究[J]. 赵文娟,刘忠宝. 计算机与网络. 2012(01)
硕士论文
[1]基于GBDT模型的股价趋势预测研究[D]. 洪嘉灏.暨南大学 2017
[2]结合N-gram模型与句法分析的语法纠错[D]. 沈涛.东南大学 2017
[3]基于主题模型的藏汉跨语言信息检索查询扩展研究[D]. 高璐.中央民族大学 2017
[4]对TF-IDF算法的改进及实验研究[D]. 何晓静.吉林大学 2017
[5]搜索广告长尾查询的在线扩展方法研究[D]. 李亚林.哈尔滨工程大学 2017
[6]基于改进的GBDT算法的乘客出行预测研究[D]. 王天华.大连理工大学 2016
[7]基于用户意图识别的查询重构研究[D]. 吴家丽.哈尔滨工程大学 2016
[8]基于深度学习的搜索广告点击率预测方法研究[D]. 李思琴.哈尔滨工业大学 2015
[9]基于长尾查询需求理解的搜索引擎性能改进[D]. 霍帅.清华大学 2015
[10]一种利用TF-IDF方法结合词汇语义信息的文本相似度量方法研究[D]. 王子慕.吉林大学 2015
本文编号:3432585
【文章来源】:西南交通大学四川省 211工程院校 教育部直属院校
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 语义理解
1.2.2 广告排序
1.3 论文研究内容
1.4 论文组织结构
第2章 语义理解和广告排序的研究方法
2.1 预备知识
2.1.1 PageRank算法
2.1.2 Word2Vec模型
2.1.3 TF-IDF算法
2.1.4 GBDT模型
2.2 查询短语的语义理解
2.2.1 问题定义
2.2.2 研究思路概述
2.3 多查询下的广告排序实现
2.3.1 问题定义
2.3.2 研究思路概述
2.4 本章小结
第3章 融入查询短语潜在信息的语义理解方法
3.1 基于概率的语义理解方法
3.2 本文的语义理解方法线上线下的工作过程
3.3 基于查询短语潜在信息的查询意图预测
3.3.1 特征描述
3.3.2 特征提取与计算
3.3.3 预测流程
3.3.4 案例分析
3.4 基于Word2Vec的查询语义扩展
3.4.1 训练语料库中短语的提取
3.4.2 扩展流程
3.4.3 案例说明
3.5 本章小结
第4章 广告排序的方法研究
4.1 本文的广告排序方法线上线下的工作过程
4.2 基于贡献度求解模型和标准TF-IDF模型的广告相关性计算
4.2.1 两种常见广告相关性计算方法
4.2.2 融入贡献度求解模型的广告相关性计算
4.3 基于GBDT模型的广告点击率预估
4.4 多查询条件下广告排序的解决方案
4.5 本章小结
第5章 实验分析
5.1 实验相关数据
5.2 评测方法
5.2.1 语义理解评测方法
5.2.2 广告排序评测方法
5.3 实验环境及系统整体结构
5.4 语义理解方法的实验结果及结果分析
5.5 多查询下广告排序方法的实验结果及结果分析
5.6 本章小结
总结与展望
工作总结
工作展望
致谢
参考文献
攻读硕士学位期间发表的论文及参与的科研项目
【参考文献】:
期刊论文
[1]基于N-Gram的计算机病毒特征码自动提取的改进方法[J]. 杨燕,蒋国平. 计算机科学. 2017(S2)
[2]基于连续Skip-gram及深度学习的图像描述方法[J]. 曹刘彬,张丽红. 测试技术学报. 2017(05)
[3]基于特征学习的广告点击率预估技术研究[J]. 张志强,周永,谢晓芹,潘海为. 计算机学报. 2016(04)
[4]Word2vec的核心架构及其应用[J]. 熊富林,邓怡豪,唐晓晟. 南京师范大学学报(工程技术版). 2015(01)
[5]基于网页链接与用户反馈的PageRank算法改进研究[J]. 曹姗姗,王冲. 计算机科学. 2014(12)
[6]一种无位置偏见的广告协同推荐算法[J]. 霍晓骏,贺樑,杨燕. 计算机工程. 2014(12)
[7]基于PageRank的有向加权复杂网络节点重要性评估方法[J]. 张琨,李配配,朱保平,胡满玉. 南京航空航天大学学报. 2013(03)
[8]搜索引擎广告用户行为预测与特征分析[J]. 王海雷,贺一骏,俞学宁,张铭. 计算机应用研究. 2013(05)
[9]利用查询重构识别查询意图[J]. 张晓娟,陆伟. 现代图书情报技术. 2013(01)
[10]基于语义理解的智能搜索引擎的研究[J]. 赵文娟,刘忠宝. 计算机与网络. 2012(01)
硕士论文
[1]基于GBDT模型的股价趋势预测研究[D]. 洪嘉灏.暨南大学 2017
[2]结合N-gram模型与句法分析的语法纠错[D]. 沈涛.东南大学 2017
[3]基于主题模型的藏汉跨语言信息检索查询扩展研究[D]. 高璐.中央民族大学 2017
[4]对TF-IDF算法的改进及实验研究[D]. 何晓静.吉林大学 2017
[5]搜索广告长尾查询的在线扩展方法研究[D]. 李亚林.哈尔滨工程大学 2017
[6]基于改进的GBDT算法的乘客出行预测研究[D]. 王天华.大连理工大学 2016
[7]基于用户意图识别的查询重构研究[D]. 吴家丽.哈尔滨工程大学 2016
[8]基于深度学习的搜索广告点击率预测方法研究[D]. 李思琴.哈尔滨工业大学 2015
[9]基于长尾查询需求理解的搜索引擎性能改进[D]. 霍帅.清华大学 2015
[10]一种利用TF-IDF方法结合词汇语义信息的文本相似度量方法研究[D]. 王子慕.吉林大学 2015
本文编号:3432585
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3432585.html
最近更新
教材专著