当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向主题的个人实时搜索引擎的设计与实现

发布时间:2019-10-09 02:23
【摘要】:介绍一种专为个人用户量身订做的搜索引擎,它使用启发式实时搜索算法,为用户提供最新的主题相关信息。该系统能够结合用户需求,很好地解决综合性搜索引擎中普遍存在的主题固化、信息滞后等问题,同时为搜索引擎的个人化提供理论和实践依据。
【图文】:

模块界面,主题,网络爬虫,主题文件


题浏览模块负责主题的制定和以特定格式从主题文件中读取出搜集到的链接标题及地址,并通过一个IE插件实现对网页的浏览,如图1所示。网络爬虫模块是对现有网络爬虫的一种改进,它使用启发式的实时搜索算法,从用户指定的种子URL开始,在网络上查找主题相关信息,其结构见图2。下面对网络爬虫模块各组成部分作详·40·《现代图书情报技术》 2006年 第5期信息检索技术  总第136期

模块,网络爬虫,种子,信息检索技术


网络爬虫的一种改进,它使用启发式的实时搜索算法,从用户指定的种子URL开始,在网络上查找主题相关信息,其结构见图2。下面对网络爬虫模块各组成部分作详·40·《现代图书情报技术》 2006年 第5期信息检索技术  总第136期
【作者单位】: 江西财经大学信息学院 江西财经大学信息学院
【分类号】:TP391.3

【参考文献】

相关期刊论文 前1条

1 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期

【共引文献】

相关期刊论文 前10条

1 高灵霞;;基于主题爬虫的个性化搜索引擎技术分析[J];电脑知识与技术;2009年32期

2 徐诗亮;;一种基于概念空间的主题爬虫设计方法[J];福建电脑;2008年10期

3 邱均平,张洋;网络信息计量学综述[J];高校图书馆工作;2005年01期

4 付涛;戴玉刚;周登;;链接分析在主题信息检索系统中的应用[J];电脑与电信;2009年01期

5 李园伟;;面向高校主题搜索引擎的的爬行器设计[J];电脑知识与技术;2011年16期

6 付光;;面向招聘信息主题搜索引擎的研究与设计[J];广西教育;2011年18期

7 李艳生;汪自云;;基于遗传算法的Web主题库成长技术研究[J];湖北师范学院学报(自然科学版);2010年04期

8 李广丽;刘觉夫;;面向URL的网络机器人软件模型的研究与实现[J];华东交通大学学报;2007年01期

9 谭爱平;成亚玲;;搜索引擎技术综述[J];湖南工业职业技术学院学报;2008年03期

10 陈方;谭爱平;成亚玲;文益民;;主题爬虫技术研究综述[J];湖南工业职业技术学院学报;2008年05期

相关硕士学位论文 前10条

1 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年

2 王斐;基于增量反馈和自适应机制的主题爬虫系统的设计与实现[D];南京理工大学;2005年

3 王晓华;基于内容的搜索引擎技术研究及其应用[D];郑州大学;2005年

4 姜杰;专业搜索引擎分布式Robot设计研究[D];南京师范大学;2005年

5 叶昭晖;网络信息雷达系统的研究与设计[D];国防科学技术大学;2005年

6 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年

7 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年

8 姜鑫维;基于分布式的智能搜索引擎[D];武汉理工大学;2006年

9 刘强国;主题搜索引擎设计与研究[D];电子科技大学;2007年

10 赵钦;并行爬行器的架构与优化策略[D];北京工业大学;2006年

【二级参考文献】

相关期刊论文 前1条

1 曹军;Google的PageRank技术剖析[J];情报杂志;2002年10期

相关会议论文 前1条

1 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

【相似文献】

相关期刊论文 前10条

1 于成龙;于洪波;;网络爬虫技术研究[J];东莞理工学院学报;2011年03期

2 王芳;陈海建;;深入解析Web主题爬虫的关键性原理[J];微型电脑应用;2011年07期

3 魏毅峰;;产品评论检索系统设计[J];现代经济信息;2011年14期

4 ;李彦宏论搜索引擎三个定律[J];新电子;2001年02期

5 相春雷;;2009年中国搜索引擎市场趋势分析[J];软件世界;2010年02期

6 郭晓霞;王磊;席岩;王晓艳;汪瑛;;基于网络的视频内容检索与盗版追踪溯源研究[J];广播与电视技术;2011年07期

7 张春菊;张雪英;朱少楠;徐希涛;;基于网络爬虫的地名数据库维护方法[J];地球信息科学学报;2011年04期

8 ;揭秘搜索引擎收录网站的秘密[J];计算机与网络;2010年Z1期

9 张睿涵;林振荣;李建民;衷湾;;基于主题定制的专利网络爬虫的设计与实现[J];计算机与现代化;2011年07期

10 金凡;顾进广;;一种改进的T-Spider分布式爬虫[J];微电子学与计算机;2011年08期

相关会议论文 前10条

1 刘凡平;高艳华;于炯;张伟;;基于关键决策方法的站内搜索研究与实现[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

2 徐剑;柯贵明;;网络爬虫技术在搜索引擎中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

3 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

4 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

5 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

6 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

7 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

8 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

9 王凯;刘代志;李东旭;齐玮;;地球物理环境情报搜集系统研究[A];国家安全地球物理丛书(四)——地球物理环境探测和目标信息获取与处理[C];2008年

10 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

相关重要报纸文章 前10条

1 记者 毛涛涛;优酷主动屏蔽搜索引擎[N];北京商报;2008年

2 实习生 杨海鹏;2008中国搜索引擎市场突破50亿元[N];中国新闻出版报;2009年

3 记者 张良;给搜索引擎排座次,首份“搜索榜”出炉[N];新华每日电讯;2009年

4 孟飞鸿;今年搜索引擎市场增幅近四成[N];中国税务报;2009年

5 本报记者 张韬;中国搜索引擎用户规模达2.03亿[N];上海证券报;2009年

6 记者 崔逾瑜 实习生 石小利;“搜索引擎依赖症”悄然浮现[N];湖北日报;2009年

7 夏言;全球搜索引擎营销大会四月在厦门举行[N];国际商报;2009年

8 本报记者 廖庆升;洪波:谷歌逆市招聘表明搜索引擎将一枝独秀[N];通信信息报;2009年

9 张黎明;搜索引擎行业立法监管提速[N];中国高新技术产业导报;2009年

10 记者 戈清平;三季度搜索引擎收入增长放缓[N];中国高新技术产业导报;2008年

相关博士学位论文 前10条

1 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

4 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

5 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

6 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

8 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

9 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

10 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年

相关硕士学位论文 前10条

1 梁萍;搜索引擎中网络爬虫及结果聚类的研究与实现[D];中国科学技术大学;2011年

2 龚勇;搜索引擎中网络爬虫的研究[D];武汉理工大学;2010年

3 夏亮;主题搜索引擎网络爬虫搜索策略的研究与实现[D];北京化工大学;2010年

4 郭海燕;搜索引擎中网络爬虫技术研究[D];西安电子科技大学;2009年

5 李春生;基于WEB信息采集的分布式网络爬虫搜索引擎的研究[D];吉林大学;2009年

6 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年

7 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年

8 苏旋;分布式网络爬虫技术的研究与实现[D];哈尔滨工业大学;2006年

9 刘青伟;搜索引擎中的Pagerank排序算法研究分析[D];电子科技大学;2010年

10 范慧;以博客内容为对象的个性化搜索研究[D];华中科技大学;2010年



本文编号:2546554

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2546554.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户823ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com