搜索引擎的相关性排序算法研究.pdf 全文
本文关键词:搜索引擎的相关性排序算法研究,由笔耕文化传播整理发布。
中国科学技术大学
硕士学位论文
搜索引擎的相关性排序算法研究
姓名:王黎
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:帅建梅
20100427
摘 要
摘 要
随着计算机系统性能的提高和网络技术的不断进步,万维网成为全球最大的信
息资源库,如何为如此庞大的信息资源提供高效的导航服务,帮助用户在海量的数
据中快速找到需要的信息是搜索引擎亟待解决的问题。通常用户只关心搜索引擎返
回的排在前面的结果,然而当前搜索引擎返回的查询结果与用户需求的相关程度并
不理想。于是搜索引擎的相关性排序--按照与用户查询的相关程度对搜索引擎的索
引文档进行排序,成为当前研究的重点和热点。
本文首先研究了文本搜索引擎的相关性排序模型,并为自学习排序模型提出一
种构造训练集的方法。然后研究了图像搜索引擎的相关性排序问题,重点介绍了图
像重排序的方法,并提出一种度量图像相似性的方法。本文对搜索引擎的相关性排
序方法进行了深入的研究,主要工作和创新之处归纳为以下几点:
(1) 文本搜索引擎的相关性排序模型,包括布尔模型,向量空间模型,概率模
型,超链接模型,自学习排序模型,其中自学习排序模型将机器学习的方法
运用到搜索引擎的相关性排序问题,解决了以往模型的许多不足之处。
(2) 为自学习排序模型构造训练集。自学习排序是一种有监督的机器学习算法,,
模型的性能很大程度上依赖训练集。构造训练集
本文关键词:搜索引擎的相关性排序算法研究,由笔耕文化传播整理发布。
本文编号:99835
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/99835.html