当前位置:主页 > 科技论文 > 搜索引擎论文 >

文档聚类技术在搜索引擎中的应用研究

发布时间:2019-03-30 14:12
【摘要】:随着互联网上信息数量的不断增长,传统的信息检索技术已经很难满足人们对查询质量的苛刻要求。为了方便用户从检索结果中快速、准确地定位自己想要的信息,集成了文档聚类功能的搜索引擎应运而生。本文讨论了文档聚类技术在搜索引擎中的应用问题,介绍了一些算法,重点分析了Vivisimo这个比较有代表性的聚类搜索引擎,并预测了搜索引擎聚类技术的发展趋势。
[Abstract]:With the increasing amount of information on the Internet, the traditional information retrieval technology has been difficult to meet the stringent requirements of query quality. In order to facilitate users to locate the information they want quickly and accurately from the retrieval results, the search engine which integrates the function of document clustering emerges as the times require. This paper discusses the application of document clustering technology in search engine, introduces some algorithms, analyzes Vivisimo, a representative clustering search engine, and predicts the development trend of search engine clustering technology.
【作者单位】: 四川大学公共管理学院;
【分类号】:G354

【参考文献】

相关期刊论文 前6条

1 陶跃华,陈丽萍,王泳;聚类分析在搜索引擎中的应用[J];计算机工程与应用;2003年21期

2 靖培栋;田亮;;聚类在搜索引擎中的应用[J];情报理论与实践;2006年04期

3 宾锋;信息检索的新方法——检索结果自动聚类[J];情报杂志;2002年11期

4 王楠;基于聚类的全文检索系统后处理[J];情报杂志;2005年01期

5 曹锦丹,王丽伟,齐艳丽;可视化技术在网络信息检索中的应用[J];情报杂志;2005年08期

6 曹红兵;;搜索引擎的个性化检索研究[J];图书情报工作;2007年03期

相关硕士学位论文 前1条

1 韩建福;文档聚类在搜索引擎结果中的应用研究[D];北京交通大学;2007年

【共引文献】

相关期刊论文 前10条

1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期

2 李玉擰;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期

3 李育嫦;搜索引擎中完善关键词检索功能的探索[J];图书与情报;2003年05期

4 吴锐;丁树良;甘登文;;一种新的项目反应理论等值准则——余弦准则[J];江西师范大学学报(自然科学版);2008年02期

5 刘文婷;滕奇志;;后缀树聚类在专用搜索引擎中的应用研究与改进[J];成都信息工程学院学报;2010年03期

6 罗金增;;基于模糊聚类的个性化Web信息检索系统研究[J];电脑知识与技术;2005年35期

7 易爱平;廖祝华;张惠;;基于Google的个性化搜索系统的设计与实现[J];电脑知识与技术(学术交流);2007年01期

8 盛魁;赵鹏;;中文网页自动分类综述[J];电脑知识与技术;2010年27期

9 赵玉茗;徐志明;王晓龙;朱鲲鹏;;基于词汇集聚的文档相关性计算[J];电子与信息学报;2008年10期

10 程华;;基于特征提取的中文检索方法研究[J];福建电脑;2006年12期

相关会议论文 前5条

1 王凯;刘代志;李东旭;齐玮;;地球物理环境情报搜集系统研究[A];国家安全地球物理丛书(四)——地球物理环境探测和目标信息获取与处理[C];2008年

2 顾寄南;陈晓燕;;检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(下册)[C];2008年

3 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年

4 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年

5 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年

相关博士学位论文 前10条

1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年

2 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年

3 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年

4 刘伟;图像检索中若干问题的研究[D];浙江大学;2007年

5 刘书暖;工艺知识发现与重用技术[D];西北工业大学;2007年

6 周健;结构化对等网络中的关键技术研究[D];中国科学技术大学;2008年

7 徐建民;基于术语关系的贝叶斯网络信息检索模型扩展研究[D];天津大学;2007年

8 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年

9 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年

10 金博;面向专利和零部件的设计知识检索方法[D];大连理工大学;2009年

相关硕士学位论文 前10条

1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

2 李健;基于内容的新闻视频检索关键技术研究[D];哈尔滨理工大学;2010年

3 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年

4 赵军;基于流形对齐的论坛个性化推荐与检索[D];浙江大学;2011年

5 阿圆;高校校园网论坛热点话题发现系统的研究与实现[D];昆明理工大学;2009年

6 荣建文;基于RS-SVM的Web中文文本自动分类研究[D];东北财经大学;2010年

7 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年

8 郭海燕;搜索引擎中网络爬虫技术研究[D];西安电子科技大学;2009年

9 孟星;基于Agent的自适应信息检索系统技术研究[D];西安电子科技大学;2009年

10 李霞;文本过滤防火墙技术研究[D];北方工业大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 万跃华,王卫国;科研工作者的检索引擎──Northern Light[J];电脑技术;1998年08期

2 行小帅,焦李成;数据挖掘的聚类方法[J];电路与系统学报;2003年01期

3 程军,刘斌中;数字图书馆海量文本全文检索系统[J];大学图书馆学报;2002年05期

4 王爱华,张铭,杨冬青,唐世渭;PCCS部分聚类分类:一种快速的Web文档聚类方法[J];计算机研究与发展;2001年04期

5 吴斌,傅伟鹏,郑毅,刘少辉,史忠植;一种基于群体智能的Web文档聚类算法[J];计算机研究与发展;2002年11期

6 林鸿飞;基于Web的信息过滤机制[J];计算机工程与应用;2002年02期

7 王树梅,金澎;词间相关性在Web检索中的新应用[J];计算机工程与应用;2002年21期

8 李景霞,侯紫峰;Web服务组合综述[J];计算机应用研究;2005年12期

9 宋震,郭海霞;浅析基于超文本的全文检索技术[J];津图学刊;2003年04期

10 卢刘明,朱国进,陈家训;Web service集成标记语言关键技术研究[J];计算机应用与软件;2005年09期

相关博士学位论文 前2条

1 任志宏;Web服务复合的若干关健问题研究[D];中国科学院研究生院(软件研究所);2004年

2 汤景凡;动态Web服务组合的关键技术研究[D];浙江大学;2005年

相关硕士学位论文 前1条

1 刘媛媛;基于Agent的Web服务组合研究[D];南京航空航天大学;2005年

【相似文献】

相关期刊论文 前10条

1 韩建福;卢苇;;文档聚类在Web搜索结果中的应用研究[J];中国科技信息;2006年23期

2 张辉;谢科;庞斌;吴辉;;一种基于关键特征的搜索引擎结果聚类算法[J];北京航空航天大学学报;2007年06期

3 石琼;潘广贞;;基于搜索引擎的文本主题识别[J];装备制造技术;2009年06期

4 陈福集,杨善林;一种基于KDD的Web搜索引擎框架[J];情报学报;2002年03期

5 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期

6 ;关键词搜索[J];每周电脑报;2000年38期

7 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期

8 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期

9 周毅华;从搜索引擎的分类看其应用技巧[J];图书馆理论与实践;2002年06期

10 邹小筑;搜索引擎的选择与使用技巧[J];图书馆学研究;2002年05期

相关会议论文 前10条

1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

7 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

8 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

9 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年

10 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年

相关重要报纸文章 前10条

1 李一鑫;搜索排名的红与黑[N];财经时报;2007年

2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年

3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年

4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年

5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年

6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年

7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年

8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年

9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年

10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年

相关博士学位论文 前10条

1 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年

2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

3 刘铭;大规模文档聚类中若干关键问题的研究[D];哈尔滨工业大学;2010年

4 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

5 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

6 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

7 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

8 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

9 周,

本文编号:2450157


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2450157.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24763***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com