深度web资源搜索关键技术
本文选题:搜索引擎 切入点:信息抽取 出处:《北京航空航天大学学报》2009年01期
【摘要】:深度web资源是指通过web搜索等形式能够访问的网络数据库资源,由于它与静态网页存在着一些差异,传统的搜索引擎技术不能够很好的实现深度web资源搜索.研究了深度web资源搜索中的若干关键技术,包括深度web资源的自动发现和基于本体的深度web数据抽取.通过实验验证了所提出技术的可用性与高效性.设计和实现了一种新的针对深度web资源的搜索引擎系统,能够获取深度web资源信息,并且利用这些信息抽取出结构化数据,从而为用户或者其他应用系统提供服务.已经应用在国家重大工程项目"国家科技基础条件平台门户应用系统"中,并取得了很好的应用效果.
[Abstract]:Deep web resource is a kind of network database resource which can be accessed by web search. Because of its difference from static web page, traditional search engine technology can not realize deep web resource search well.In this paper, some key technologies of deep web resource search are studied, including automatic discovery of deep web resource and extraction of deep web data based on ontology.The availability and efficiency of the proposed technology are verified by experiments.A new search engine system for deep web resources is designed and implemented. It can obtain the information of deep web resources and extract structured data from these information to provide services for users or other application systems.It has been applied in the national important engineering project "the national science and technology foundation condition platform portal application system", and has obtained the very good application effect.
【作者单位】: 北京航空航天大学计算机学院;中国电子信息产业发展研究院;
【基金】:国家科学技术部基金资助项目(2005DKA63901)
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 毕蕾;沈洁;徐法艳;魏榴花;朱燕;孙荣霜;;领域本体指导的Web商品信息抽取[J];计算机工程与设计;2008年24期
2 郭浩;刘伟;段富;;基于Web的语料自动采集技术研究[J];太原理工大学学报;2008年S1期
3 高明;王继成;李江峰;;基于语义支持的Deep Web数据抽取[J];计算机科学;2010年03期
4 魏常丽;刘玉玲;;搜索引擎结果去重Agent系统[J];内蒙古科技与经济;2006年03期
5 阎亚杰;;网页去重方法研究[J];电脑开发与应用;2008年08期
6 赵修文;刘伍颖;王挺;;基于本体的医疗信息搜索技术[J];计算机工程;2009年06期
7 杨鹏,叶少珍;基于关键词和语义融合的WEB检索[J];福建电脑;2005年08期
8 王美霞;;智能语义搜索引擎的探究[J];电脑知识与技术;2009年12期
9 汲业;陈燕;杨健;慕蓉;;生活服务领域垂直搜索引擎的设计与实现[J];计算机工程;2010年24期
10 王星星;毕建涛;池天河;;基于元数据的语义识别搜索方法的研究与实现[J];测绘科学;2008年05期
相关会议论文 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 褚蓓蓓;刘丹;;垂直搜索引擎:搜索引擎发展方向[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
3 陈沛;;搜索的未来[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
5 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
8 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
9 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
10 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
相关重要报纸文章 前10条
1 李一鑫;搜索排名的红与黑[N];财经时报;2007年
2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
8 本报记者 赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年
相关博士学位论文 前10条
1 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
2 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
3 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
4 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
5 王葆华;动词的语义及论元配置[D];复旦大学;2003年
6 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
7 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
8 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
9 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
10 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
相关硕士学位论文 前10条
1 蒋伟华;搜索引擎中的信息抽取技术研究[D];湖南大学;2001年
2 魏常丽;搜索引擎结果的再检索[D];内蒙古大学;2005年
3 马安香;基于分类语义的Web信息抽取机制的研究与实现[D];东北大学;2005年
4 刘金亮;汽车行业垂直搜索系统原型的设计与关键模块的实现[D];北京邮电大学;2008年
5 周锦姝;基于Web和信息抽取技术的自动术语翻译[D];天津大学;2007年
6 金岳富;Web信息采集与信息抽取技术的研究[D];哈尔滨理工大学;2009年
7 毕蕾;基于领域本体的Web信息抽取技术研究[D];扬州大学;2008年
8 邓丽;面向主题的XML网页的模式和数据抽取[D];华侨大学;2004年
9 张波;PDF文档语义信息抽取研究[D];河北大学;2004年
10 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
本文编号:1693175
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1693175.html