一种改进的综合Borda元搜索引擎结果排序算法
本文关键词: 元搜索 摘要排序 相似度计算 Borda算法 出处:《计算机光盘软件与应用》2014年04期 论文类型:期刊论文
【摘要】:在传统的元搜索引擎中采用了Borda排序算法,即根据成员引擎检索结果的相关位置赋予一定分值,求和后按总分递减排序。这对各个成员引擎检索结果重叠度较高的检索排序非常有效,但对独立的搜索结果效果不好,速度较慢。另有根据检索字符串和检索结果的标题、摘要等相似度进行排序,这种排序快速,实现简单,但返回的信息简单,可能导致摘要信息多的排在前面,而不是内容相关的高的排在前面。针对这两种算法的不足,提出了一种改进的综合Borda排序算法,计算检索字符串和结果标题、摘要的相似度,再把相似度作为相关分值进行排序,它综合了两种算法。实验结果表明,他的查准率优于传统的Borda算法。
[Abstract]:In the traditional meta search engine, the Borda sorting algorithm is used, that is, according to the member engine search results of the relevant position to give a certain score. It is very effective for each member engine to search the search result with high overlap degree, but it is not good for the independent search results. In addition, according to the search string and the title of the retrieval results, summary and other similarity to sort, this sort of quick, easy to achieve, but the information returned is simple, may lead to more summary information in the first place. In view of the shortcomings of the two algorithms, an improved comprehensive Borda sorting algorithm is proposed to calculate the similarity between the search string, the result title and the summary. Then the similarity is sorted as the correlation value, which combines two algorithms. The experimental results show that the precision of the algorithm is better than that of the traditional Borda algorithm.
【作者单位】: 吉首大学软件服务外包学院;
【基金】:大学生研究性学习和创新性实验计划项目(项目编号:JSU-CX-2012-54)
【分类号】:TP391.3
【正文快照】: 元搜索引擎是包含了多个搜索引擎的特殊搜索引擎。用户输入查询请求后,元搜索引擎向各个成员搜索引擎并行发送检索请求,检索完成后,检索结果通过去重排序处理后返回给用户。将多个搜索引擎的结果放到一起,这样可以扩大检索范围,提高查全率。但是要将这么海量的数据融合到一起,
【参考文献】
相关期刊论文 前6条
1 王晓艳;于光华;刘春双;;经典搜索引擎排序算法的比较与分析[J];产业与科技论坛;2012年24期
2 曹林;韩立新;吴胜利;;元搜索引擎排序技术综述[J];计算机应用研究;2009年02期
3 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
4 董乐;谢红薇;;元搜索引擎中排序融合算法的优化研究[J];计算机应用与软件;2012年10期
5 杨春明;何天翔;;元搜索引擎的结果去重及排序研究[J];软件;2012年06期
6 林欣;温传林;韩立新;;一种元搜索主题偏好的排序算法[J];计算机技术与发展;2013年02期
【共引文献】
相关期刊论文 前10条
1 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
2 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
3 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
4 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
5 刘小明;樊孝忠;李方方;;一种结合本体和焦点的问题分类方法[J];北京理工大学学报;2012年05期
6 秦超;;远程教学平台中开放式综合答疑系统研究[J];中国远程教育;2006年10期
7 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期
8 张雪芬;李德玉;王素格;南瑞贤;;基于统计方法的面向旅游问句分类实验研究[J];电脑开发与应用;2009年01期
9 陈玉;;基于关键词距离的中文问答系统研究[J];电脑开发与应用;2011年01期
10 李照亮;张琳;;基于招生领域自动问答系统的问题理解的研究[J];电脑知识与技术;2009年10期
相关会议论文 前10条
1 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
2 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 吴晨;张全;;基于HNC的自然语言问答处理系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
4 文勖;张宇;刘挺;;类别主特征结合句法特征的中文问题层次分类[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
6 高俊杰;李茹;李双红;;基于领域本体的自动问答系统关键技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 仇伟;黄高辉;姚天f ;;基于HowNet的汉语情感问句二层分类[A];第六届全国信息检索学术会议论文集[C];2010年
8 葛正荣;李婷玉;姚天f ;;汉语情感问题类型分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 栾家阳;张文波;姚天f ;;基于汽车领域的情感问答系统设计与实现[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 周利民;童珉;陈燕双;;面向互联网视频主题管理的搜索引擎关键技术研究及实现[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(二等奖)[C];2014年
相关博士学位论文 前10条
1 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
2 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
3 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
4 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
5 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
6 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
7 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
8 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
9 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
10 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
相关硕士学位论文 前10条
1 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
2 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
3 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
4 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
5 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
6 李英伟;基于增量改进贝叶斯领域问句分类研究[D];昆明理工大学;2009年
7 赵全;基于半监督学习的中文问句分类研究[D];昆明理工大学;2010年
8 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
9 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
10 李欢;基于多Agent及元搜索技术的中文问答系统的研究和应用[D];石家庄铁道学院;2009年
【二级参考文献】
相关期刊论文 前10条
1 李红梅;丁振国;周水生;周利华;;元搜索引擎结果合成算法[J];北京邮电大学学报;2008年05期
2 张玉连;王莎莎;宋桂江;;基于元搜索的网页去重算法[J];燕山大学学报;2011年02期
3 张强弓,喻国宝,廖湖声,隋树林;一种元搜索引擎的查询结果处理模型[J];华南理工大学学报(自然科学版);2004年S1期
4 文坤梅,卢正鼎,陈莉,邓曦;元搜索引擎中检索结果排序的优化方法[J];华中科技大学学报(自然科学版);2003年03期
5 张岭,马范援;加速评估算法:一种提高Web结构挖掘质量的新方法[J];计算机研究与发展;2004年01期
6 彭喜化,张林,余建桥;基于Agent的元搜索引擎结果优化技术[J];计算机应用;2003年12期
7 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期
8 曹林;韩立新;吴胜利;;元搜索引擎排序技术综述[J];计算机应用研究;2009年02期
9 刘丽;;元搜索引擎检索性能分析[J];情报探索;2011年04期
10 盛宪锋,山岚;基于元搜索引擎的专业式智能网络信息检索系统[J];计算机工程与设计;2004年01期
相关硕士学位论文 前2条
1 孟星;基于Agent的自适应信息检索系统技术研究[D];西安电子科技大学;2009年
2 胡升泽;个性化元搜索引擎若干关键技术研究[D];国防科学技术大学;2008年
【相似文献】
相关期刊论文 前10条
1 刘丽,孙燕唐;智能型元搜索引擎的设计与实现[J];计算机工程;2003年06期
2 谢树龙,张杰,刘洪,仪熊晓;元搜索引擎技术分析[J];天津通信技术;2004年02期
3 何晓聪;元搜索引擎的理论与实践[J];现代情报;2004年08期
4 曾伟忠,徐昕;搜索引擎及元搜索引擎工作原理及存在的不足[J];图书馆学刊;2004年05期
5 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机(专业版);2004年05期
6 刘畅,林剑锋,王雁杰;元搜索引擎的调查分析[J];现代图书情报技术;2004年09期
7 徐戈;一个文件元搜索引擎的设计与实现[J];情报探索;2004年04期
8 吴国文,乐嘉锦,陈国梁;源搜索可定制的元搜索引擎设计技术[J];计算机应用与软件;2004年12期
9 黄素珍,陈宁江,苏德富;并发多元搜索引擎的研究与应用[J];广西大学学报(自然科学版);2005年02期
10 原福永;梁顺攀;;元搜索引擎的现状与发展[J];计算机工程与设计;2005年12期
相关会议论文 前9条
1 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
2 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 诸葛建伟;袁春阳;;基于元搜索引擎实现被篡改网站发现与攻击者调查剖析[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
6 丁山山;陈世平;;智能Agent技术在个性化WEB信息代理中的应用研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
9 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
相关重要报纸文章 前1条
1 喻芸;管理和科研:如何利用网络资源[N];学习时报;2007年
相关博士学位论文 前3条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
相关硕士学位论文 前10条
1 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
2 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
3 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
4 李炎茗;元搜索引擎的现状研究与改进设计[D];华中师范大学;2002年
5 洪颖;面向化工领域的智能元搜索引擎系统的研究与设计[D];北京化工大学;2004年
6 蔡春勇;元搜索引擎的智能化及其设计与实验[D];福州大学;2006年
7 王小朋;基于代理的元搜索引擎的研究[D];辽宁工程技术大学;2005年
8 魏振达;基于服务的元搜索引擎研究[D];南华大学;2006年
9 李信利;基于信息类别的元搜索引擎研究[D];山东大学;2006年
10 谢江标;最优搜索理论在元搜索引擎中的应用研究[D];电子科技大学;2007年
,本文编号:1476038
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1476038.html