基于聚类分析的搜索引擎自动性能评价
本文选题:信息检索 + 性能评价 ; 参考:《中文信息学报》2010年05期
【摘要】:传统的搜索引擎性能评价方法需要人工标注标准答案集,需花费大量的人力物力,并且评价结果依赖于人工标注的准确性,效率较低。该文基于聚类分析的思路,提出了一种搜索引擎性能评价指标和自动进行搜索引擎性能评价的方法,此方法能自动计算信息类查询的覆盖范围,并根据其覆盖范围对检索结果进行聚类,通过类间距和类内距等指标实现检索性能的自动评价。实验结果表明,基于聚类指标的评价方法与人工标注的评价方法的评价结果是相一致的。
[Abstract]:The traditional evaluation method of search engine performance needs manual tagging standard answer set, which requires a lot of manpower and material resources, and the evaluation result depends on the accuracy of manual annotation, and the efficiency is low. Based on the idea of clustering analysis, this paper puts forward a method of evaluating the performance of search engine and automatically evaluating the performance of search engine. This method can automatically calculate the coverage of information class query. According to its coverage range, the retrieval results are clustered, and the retrieval performance is automatically evaluated by the index of the space between classes and the distance between classes. The experimental results show that the evaluation method based on clustering index is consistent with the evaluation method based on manual labeling.
【作者单位】: 江西师范大学计算机信息工程学院;
【基金】:国家自然科学基金资助项目(60963014) 江西省自然科学基金资助项目(2008GZS0052) 江西省科技攻关项目(2006-184) 江西省教育厅科技课题(2007-129)
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 张文慧;张冉;;基于中文分词的农业信息检索平台设计[J];安徽农业科学;2011年20期
2 杨永健;;浅议图书馆新型OPAC系统发展趋势——以汇文OPAC系统为例[J];四川图书馆学报;2011年03期
3 黄名选;朱家安;冯平;;基于正负关联规则融合的信息检索模型[J];情报理论与实践;2011年07期
4 吴谋硕;;基于用户信息的信息检索效果提高策略[J];电脑知识与技术;2011年21期
5 刘劲松;张彬;柴文磊;魏建行;刘振鹏;;校园网园区搜索引擎的设计与实现[J];河北大学学报(自然科学版);2011年04期
6 吴庆涛;芮跃峰;张卫星;;个性化搜索引擎中的用户兴趣模型分析与研究[J];现代计算机;2011年08期
7 艾丹祥;左晖;杨君;;网络信息检索中相关反馈技术的Java实现[J];电脑知识与技术;2011年16期
8 徐建民;陈振亚;;一种用于结构化文档检索的贝叶斯网络[J];计算机工程;2011年13期
9 谢根甲;王昊;;全国民办高校综合检索数据库建设与构想[J];兰台世界;2011年15期
10 李明辉;;Thomson Reuters Integrity助力药物研发[J];中华医学图书情报杂志;2011年04期
相关会议论文 前10条
1 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
3 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
4 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 吴立德;黄萱菁;;前言[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年
9 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
10 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关重要报纸文章 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
3 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
4 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
5 于振海;Microsoft Office 2003的翻译服务你用了吗?[N];中国电脑教育报;2004年
6 高丽华;信息化遭遇新雷区[N];计算机世界;2007年
7 李茂 编译;创新是技术素养的第一要求[N];中国教师报;2007年
8 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
9 西安 张树忠 时剑;如何使用Word 2003翻译功能[N];电子报;2004年
10 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
相关博士学位论文 前10条
1 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
2 董道国;高维数据索引结构研究[D];复旦大学;2005年
3 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
4 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
5 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
6 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
7 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年
8 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
9 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
10 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
相关硕士学位论文 前10条
1 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
2 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
3 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年
4 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
5 史锦荣;基于多Agent智能搜索引擎模型研究[D];太原理工大学;2005年
6 吴媛媛;移动终端上个人信息检索核心子系统的设计与实现[D];北京邮电大学;2011年
7 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
8 曹双喜;研究生在CNKI数字图书馆信息检索过程中的选择行为研究[D];西南大学;2006年
9 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
10 袁晓丰;列表类自动问题问答系统的设计与实现[D];复旦大学;2008年
,本文编号:1894919
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1894919.html