基于深度语义的多模型学习排序研究
发布时间:2022-08-08 11:44
随着计算机信息技术的飞速发展,网上购物已经慢慢进入我们的日常生活,从本质上影响并逐渐改变了人们的购物消费习惯。网上购物的飞速发展在给电商带来巨大收益的同时,也为消费者带来方便,例如可以随时随地网上购物,方便快捷。但是随着网上商品种类以及相似种类越来越多,用户在面对大量的搜索结果的同时亦面临商品标签或者标题掺入高排名或与商品相关度不高的词汇,导致搜索精度不高、商品分类粗糙以及搜索结果的页面显示混乱等问题。面对以上多种问题,本文从传统的信息检索领域出发,研究了常用的信息检索模型,并对Pointwise、Pairwise以及Listwise这三种方法进行了系统的实验对比分析;在此基础上,首先分析了机器学习中学习排序模型训练与测试的整体流程及Bag-of-words模型,为了提高现有模型的商品搜索精度,提出“商品图像深度语义”概念,并综合“特征工程”和“学习”两方面建立特征构造方法;之后,针对Listwise模型进行剖析,重点研究其计算过程中分数序列转化为概率分布的机理,通过优选实验,确定以整个序列为例的ListNet方法是解决商品搜索过程中排序学习流程最直接、最有效的方法;针对ListNet...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.2 研究现状
1.3 研究目标与内容
1.4 论文的组织结构
第二章 相关理论和技术
2.1 传统排序模型
2.1.1 布尔模型
2.1.2 向量空间模型
2.1.3 概率检索模型
2.1.4 语言模型
2.2 排序学习概述
2.2.1 单文档方法(Pointwise方法)
2.2.2 文档对方法(Pairwise方法)
2.2.3 文档列表方法(Listwise方法)
2.3 本章小结
第三章 排序学习模型构建
3.1 特征工程
3.1.1 特征工程的概况
3.1.2 特征工程的子过程
3.2 模型的训练
3.3 训练数据构建
3.4 特征集的构建
3.4.1 关于查询与文档的特征
3.4.2 有关于商品特性的特征
3.4.3 Bag-of-words图片语义特征向量提取
3.5 对商品进行学习排序的结果评价方法
3.5.1 学习排序无序结果评价方法
3.5.2 学习排序有序结果评价标准
3.6 排序学习与常规机器学习的异同之处
3.7 本章小结
第四章 基于深度语义的多模型学习排序
4.1 ListNet算法
4.2 组合概率
4.3 Top-1概率
4.4 损失函数的融合
4.5 改进的ListNet算法描述
4.6 本章小结
第五章 实验及结果分析
5.1 实验环境
5.2 数据集
5.3 不同模型结果的比较与分析
5.4 基于改进的ListNet算法结果分析
5.5 不同数据集结果比较分析
5.6 本章小结
总结与展望
参考文献
攻读硕士期间获得的学术成果
致谢
【参考文献】:
期刊论文
[1]基于Pairwise排序学习的因子分解推荐算法[J]. 周俊宇,戴月明,吴定会. 计算机应用与软件. 2016(06)
[2]基于图像信息和排序学习技术的疾病预测方法[J]. 黄伟,曾舒如. 南昌工程学院学报. 2015(03)
[3]基于用户行为分析的本地搜索排序算法优化[J]. 蒋宗礼,张婷. 计算机技术与发展. 2014(02)
[4]基于神经网络的Listwise排序学习方法的研究[J]. 林原,林鸿飞. 情报学报. 2012 (01)
[5]基于Listwise的新型排序算法[J]. 程凡,李龙澍. 计算机工程. 2011(23)
硕士论文
[1]针对结构化商品数据的多样性搜索系统的设计与实现[D]. 陈相如.上海交通大学 2013
[2]排序学习损失函数的研究[D]. 吴佳金.大连理工大学 2011
[3]电子商务系统中的全文检索及排序优化算法[D]. 孙文礼.浙江大学 2008
本文编号:3671446
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.2 研究现状
1.3 研究目标与内容
1.4 论文的组织结构
第二章 相关理论和技术
2.1 传统排序模型
2.1.1 布尔模型
2.1.2 向量空间模型
2.1.3 概率检索模型
2.1.4 语言模型
2.2 排序学习概述
2.2.1 单文档方法(Pointwise方法)
2.2.2 文档对方法(Pairwise方法)
2.2.3 文档列表方法(Listwise方法)
2.3 本章小结
第三章 排序学习模型构建
3.1 特征工程
3.1.1 特征工程的概况
3.1.2 特征工程的子过程
3.2 模型的训练
3.3 训练数据构建
3.4 特征集的构建
3.4.1 关于查询与文档的特征
3.4.2 有关于商品特性的特征
3.4.3 Bag-of-words图片语义特征向量提取
3.5 对商品进行学习排序的结果评价方法
3.5.1 学习排序无序结果评价方法
3.5.2 学习排序有序结果评价标准
3.6 排序学习与常规机器学习的异同之处
3.7 本章小结
第四章 基于深度语义的多模型学习排序
4.1 ListNet算法
4.2 组合概率
4.3 Top-1概率
4.4 损失函数的融合
4.5 改进的ListNet算法描述
4.6 本章小结
第五章 实验及结果分析
5.1 实验环境
5.2 数据集
5.3 不同模型结果的比较与分析
5.4 基于改进的ListNet算法结果分析
5.5 不同数据集结果比较分析
5.6 本章小结
总结与展望
参考文献
攻读硕士期间获得的学术成果
致谢
【参考文献】:
期刊论文
[1]基于Pairwise排序学习的因子分解推荐算法[J]. 周俊宇,戴月明,吴定会. 计算机应用与软件. 2016(06)
[2]基于图像信息和排序学习技术的疾病预测方法[J]. 黄伟,曾舒如. 南昌工程学院学报. 2015(03)
[3]基于用户行为分析的本地搜索排序算法优化[J]. 蒋宗礼,张婷. 计算机技术与发展. 2014(02)
[4]基于神经网络的Listwise排序学习方法的研究[J]. 林原,林鸿飞. 情报学报. 2012 (01)
[5]基于Listwise的新型排序算法[J]. 程凡,李龙澍. 计算机工程. 2011(23)
硕士论文
[1]针对结构化商品数据的多样性搜索系统的设计与实现[D]. 陈相如.上海交通大学 2013
[2]排序学习损失函数的研究[D]. 吴佳金.大连理工大学 2011
[3]电子商务系统中的全文检索及排序优化算法[D]. 孙文礼.浙江大学 2008
本文编号:3671446
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3671446.html