基于近似网页聚类的智能搜索系统
本文关键词: 信息搜索 搜索引擎 近似网页聚类 出处:《微计算机信息》2006年12期 论文类型:期刊论文
【摘要】:从Internet用户的兴趣度出发,设计了一种基于近似网页聚类的智能搜索系统。该系统在用户利用常用搜索引擎系统进行信息检索时,消除搜索引擎返回的重复页,对剩余页面进行聚类,返回给用户聚类后的网页簇,这样用户就可以选择浏览自己感兴趣的页面,从而大大提高了信息检索的查准率;实验证明该系统在保证查全率和查准率的基础上大大提高了搜索效率。
[Abstract]:Based on the interest of Internet users, an intelligent search system based on approximate web page clustering is designed, which can be used to retrieve information from common search engines. Eliminate the duplicate pages returned by the search engine, cluster the remaining pages, and return the cluster of web pages to the users, so that users can choose to browse the pages they are interested in. Therefore, the precision rate of information retrieval is greatly improved. Experiments show that the system can greatly improve the search efficiency on the basis of guaranteeing recall and precision.
【作者单位】:
【基金】:国家自然科学基金(60375001)
【分类号】:TP391.3
【正文快照】: 1引言Internet上信息搜索方式主要有两种:关键词(如Alta Vista)和目录搜索(如Yahoo)。关键词搜索和目录搜索有许多优点,然而它也都存在各自的缺陷。例如,关键词搜索引擎通常返回大量的冗余信息;而目录搜索方法则需要用户花费大量的时间进行一步步的子目录精简,而在每一步的子
【参考文献】
相关期刊论文 前2条
1 李文斌;构筑INTERNET及信息的获取[J];微计算机信息;2000年02期
2 王羲,任琦梅;基于44B0平台的uC-Linux Web服务器实现方法研究[J];微计算机信息;2005年03期
【共引文献】
相关期刊论文 前6条
1 邹治锋;张曦煌;;Linux2.6进程调度[J];微计算机信息;2006年02期
2 古鹏;徐开勇;李立新;;基于XKMS的安全Web服务组件的研究与设计[J];微计算机信息;2006年06期
3 高永平;周书民;王仁波;龚汝洪;;基于GPRS的家校信息平台的研究与实现[J];微计算机信息;2006年09期
4 李晓峰;王雅辉;;嵌入式Linux在分布式测控系统中的应用[J];微计算机信息;2007年14期
5 吕月娥;李信利;;基于信息类别的元搜索引擎设计[J];微计算机信息;2007年21期
6 张谦;王岚;王国强;;基于S3C44B0的嵌入式智能控制器设计[J];微计算机信息;2007年32期
相关会议论文 前1条
1 方勇;周安民;刘嘉勇;张志国;张雪峰;;基于内容的网络应用监控系统研究与设计[A];第十七次全国计算机安全学术交流会暨电子政务安全研讨会论文集[C];2002年
相关硕士学位论文 前10条
1 冯志将;一种电路板故障可诊断嵌入式软件设计[D];电子科技大学;2011年
2 王璐鑫;嵌入式Web服务器在远程监控中的研究与应用[D];安徽理工大学;2010年
3 李建文;济钢中板厂设备管理信息系统研究[D];大连理工大学;2002年
4 杨炜;分布式电子邮件监测与分析系统[D];四川大学;2004年
5 杨宇;基于嵌入式Web服务器的热处理远程监控系统研究[D];武汉理工大学;2006年
6 蒋吉明;基于ARM的嵌入式系统板级设计的原理、方法及应用[D];南京师范大学;2006年
7 黄凤鸣;ARM DIS系统软件设计及其网络应用开发[D];南京师范大学;2007年
8 胡海鹏;基于ARM和μClinux的嵌入式网关设计[D];华中科技大学;2006年
9 何俊;电除尘器智能控制系统设计[D];浙江大学;2007年
10 赵会娟;基于ARM9的嵌入式Linux开发平台构建与Boa的实现[D];西南交通大学;2008年
【相似文献】
相关期刊论文 前10条
1 赵京胜;周攀;;基于移动Agent的信息搜索系统设计[J];青岛理工大学学报;2007年01期
2 何素清;刘树春;;搜索引擎及其特色功能的比较与应用分析[J];现代情报;2011年06期
3 李奎;;基于智能Agent的个性化搜索引擎系统[J];和田师范专科学校学报;2008年05期
4 蔡俊武;互联网信息搜索技术[J];雁北师范学院学报;2003年02期
5 任玉梅;;网上搜索引擎信息查询的方法[J];机械管理开发;2009年06期
6 孙淑伟;张力;;搜索引擎对用户获取信息方式的影响及发展趋势[J];中国医学教育技术;2007年01期
7 柳胜国;论互联网信息搜索策略[J];情报资料工作;2002年S1期
8 郭从颖;;企业信息搜索方案初探[J];信息技术与标准化;2010年08期
9 蔡银珊;Google的使用技巧及搜索引擎的发展趋势[J];中国科技信息;2005年10期
10 ;中国政府网搜索引擎[J];中国传媒科技;2006年01期
相关会议论文 前10条
1 董红斌;苏中滨;;基于Mobile Agent的信息搜索技术[A];全国计算机网络应用年会论文集(2001)[C];2001年
2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
相关重要报纸文章 前10条
1 记者 肖扬;信息搜索分众化成为趋势[N];金融时报;2006年
2 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
3 本报记者 杨琳桦;“你是宝马,但我说了算”[N];21世纪经济报道;2006年
4 本报记者 胡军;搜索引擎迈下神坛[N];中国消费者报;2006年
5 南京大学社会学系教授 杜骏飞;构建公平健康的网络社会[N];解放日报;2008年
6 记者 林雨;网络黄页异军突起[N];民营经济报;2005年
7 商报记者 江文兵;旅游搜索引擎遭遇寒冬[N];北京现代商报;2005年
8 江文兵;旅游搜索引擎遇寒冬[N];华东旅游报;2005年
9 本报记者 杨春晖;搜索返现金能让用户上瘾?[N];中国计算机报;2008年
10 本报记者:段世文 ;林奇:演绎商用搜索引擎传奇[N];经济参考报;2005年
相关博士学位论文 前10条
1 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
2 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
3 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
4 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
5 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
6 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
7 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
8 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
9 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
相关硕士学位论文 前10条
1 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
2 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
3 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
4 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
5 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
6 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
7 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
8 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
9 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
10 袁宏;基于移动Agent的中文信息搜索引擎系统模型的研究[D];沈阳工业大学;2003年
本文编号:1472833
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1472833.html