元搜索引擎排序方法建模与算法
本文关键词:元搜索引擎排序方法建模与算法研究,由笔耕文化传播整理发布。
第39卷 第11A期2012年11月计算机科学
Comutercience SVol.39No.11A
Nov2012
元搜索引擎排序方法建模与算法研究
刘胜久 李天瑞 贾 真 尹红风
()西南交通大学信息科学与技术学院 成都610031
摘 要 元搜索引擎的核心技术是排序算法。在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架。随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜素引擎排序算法。该算法简单且易于实现。关键词 搜索引擎,元搜索引擎,排序
中图法分类号 TP391.3 文献标识码 A
ResearchonModelinandAlorithmsforRankinAroachesofMetaSearchEnine gggppg
LIUShenITianruiIAZhenIN Honfeniu - L - J Y-gggj
(,,)SchoolofInformationScienceandTechnoloSouthwestJiaotonUniversitChendu610031,China gygyg
,Abstractheketechnoloofmetasearchenineisrankinalorithm.Basedontheresearchofrankinalorithms T ygyggggg weestablishareasonablemathematicalmodeltodescribebasicmethodsofrankinalorithmsformetasearchenine ggg throuhaseriesofstesincludinsimlification.Bcombininwithmarketsharesandsearchresultsofeachsearchen -gpgpyg ,inewethenrooseanewrankinalorithm whichissimleandeastoimlement. gppggpyp
,,KewordsearchenineMetasearchenineRank S ggy
]在元搜索引擎研究方面,文献[具体讨论了中文元搜索3引擎成员搜索引擎的选择策略,并指出为提高元搜索引擎的工作效率和检准率,所选择的普通搜索引擎应该质量较高且比较稳定,对综合性搜索引擎应考虑用户认可度,对专业搜索引擎应考虑其领域特色,且将成员搜索引擎分组供用户选择,一方面使搜索更有针对性,另一方面也照顾了用户的使用偏]好。文献[对元搜索引擎资源选择融合方法进行研究,提出4了基于相关性与独特性融合的资源选择方法,给出了基于λ参数的线性融合算法,并具体说明了λ参数的估值方法,所提方法较经典的资源选择方法在检索性能上有一定程度的提]高。文献[归纳出元搜索引擎系统合成算法的5个约束条5件:一般性约束条件、对等合成的约束条件、包含合成的约束条件、不相交合成的约束条件及交搭合成的约束条件。文献[]提出了在考虑查询关键字同独立搜索引擎返回结果的相6
关性和搜索引擎数据库的影响因子的情况下,加入用户的反馈因素,使得搜索结果更贴近用户的需要,并使排序的结果更]加优化。文献[利用贝叶斯规则,结合各组成系统平均执行7推导出一种新的相关度计算公式,并提出了一种性能的信息,
新的基于概率模型的排序优化方法,从而较好地解决了结果融合中相关度规范化和均衡化的问题。文献[讨论了元搜8]索引擎涉及到的关键技术,提出了采用基于概念分组的聚类算法来解决作为元搜索引擎核心问题的搜索结果合成的问题。
本文拟通过对传统及新近元搜索引擎排序算法的分析研究,抽象出元搜索引擎排序算法的数学模型,以更好地从理论
1 引言
搜索引擎的出现是时代的产物,是为了解决互联网信息泛滥而出现的。所有搜索引擎的目的都是将互联网上最符合用户需求的信息按相关性大小返回给用户。由于不同搜索引搜索结果也存在擎的搜索算法及采取的搜索策略不尽相同,
较大的差距。当前,没有一个搜索引擎能完全满足所有用户不
]1
同类别的需求。搜索引擎的评测结果[也充分证明了这一点。
元搜索引擎可以视为搜索引擎的搜索引擎,其是伴随着搜索引擎的涌现而发展起来的。元搜索引擎一般由3部分组成,,即搜索请求提交机制、搜索接口代理机制及搜索结果显示机制。元搜索引擎的出现在一定程度上解决了需要连续使用不同独立搜索引擎重复相同检索的问题。它通过同时对多个搜索引擎进行检索来获得分级编排的排序结果。
元搜索引擎的核心是搜索前预处理和对搜索结果的集
2]
。搜索前预处理的主要目的是保证将查询请求映射到对成[
搜应搜索引擎的查询请求时查询信息不缺损。相比较而言,索结果的集成更为复杂。由于各个成员搜索引擎近乎独立,因此元搜索引擎几乎无法获知它们的技术细节。如何将从多个成员搜索引擎检索到的结果有机地融合在一起并按照一定以进一步提高元搜索引擎的查的优先关系排列显示给用户,
准率一直是元搜索引擎研究的重点。现阶段对元搜索引擎的研究主要集中在成员搜索引擎的选择及优先度系数的设置、成员搜索引擎中搜索结果相关性的确定及相关性融合算法的研究等4个方面。
),)本文受国家自然科学基金委主任基金(中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(资助。6115200120110102,:,刘胜久(男,博士生,主要研究方向为数据挖掘与知识发现等,李天瑞(男,教授,博士生导1988-)E-mailliusheniu2008@163.com;1969-)gj主要研究方向为数据挖掘与知识发现、粗糙集与粒计算等。师,
·197·
本文关键词:元搜索引擎排序方法建模与算法研究,由笔耕文化传播整理发布。
本文编号:94585
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/94585.html