稳定的信息检索方法及其在分布式环境下的应用.pdf 全文
本文关键词:稳定的信息检索方法及其在分布式环境下的应用,由笔耕文化传播整理发布。
中国科学院研究生院
博士学位论文
稳定的信息检索方法及其在分布式环境下的应用
姓名:杨志峰
申请学位级别:博士
专业:计算机科学与技术
指导教师:白硕
座机电话号码
摘要
摘要
随着人类知识的增长和网络应用的普及,以电子形式存在的自然语言信息的数量迅
速膨胀。 一力而,这种现象使人们可以方便快捷地获取信息;另一方面,如果没有合理
的榆索手段,人们将很难充分地利用这些数据。
信息检索技术“J.以帮助人们有效地对大量文本数据进行检索。但是,由于目前尚未
住自然语苦理解领域耿得突破,信息检索方法主要利用统计手段。它常常依赖于特定的
经验参数,参数优化过程繁琐,且不利用实际应用。本文试图寻找一种较为稳定的文本
检索算法和WEB信息检索方法,可以在不同的数据集和不同的检索任务中都取得较好
的检索效果。同时,它是一种平滑函数,参数在一定范围内变动时不会对结果造成剧烈
中取得了满意的成绩,同时也在2001年TREC的数据集以及早期的数据集上取得了较
好的效果。本文在TREC检索任务及其相关性判定的基础上,探讨了利用遗传算法改善
检索质量和进行参数优化的可能性。在有相关性判定的遗传算法中,通过谨慎地选择遗
传算子和遗传算法的形式以提高算法的全局和局部搜索能力,并避免早熟现象,取得了
比手工调整结果更好的检索效果。在无相关性判定的遗传算法中,本文设计了投票算法
以产生伪
本文关键词:稳定的信息检索方法及其在分布式环境下的应用,由笔耕文化传播整理发布。
,本文编号:186365
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/186365.html