基于Ontology的信息抽取
本文关键词: 信息抽取 Ontology 模板规则 出处:《计算机工程与应用》2002年23期 论文类型:期刊论文
【摘要】:为了提高Internet上的信息搜索效率,基于内容的搜索引擎成为迫切的用户需求。但内容信息的手工获取是一项繁重的工作。从文本或半结构化文档中自动地抽取用户关心的内容信息且表示成计算机能理解的形式是一项极具实用价值的挑战性研究。该文从知识表示与推理的角度研究了提高信息抽取智能性的途径,提出了将Ontology与模板规则相结合的技术,并针对线性模板表示的局限提出了基于二侧树结构的模板规则表示,同时实现了此表示下的假设生成———冲突消解推理。该技术成功地应用于招聘广告的信息抽取。
[Abstract]:In order to improve the efficiency of information search on Internet. Content-based search engine has become an urgent need of users. However, manual retrieval of content information is a heavy task. Automatically extract content information from text or semi-structured documents and express it as a computer. Comprehensible form is a challenging research of great practical value. This paper studies the ways to improve the intelligence of information extraction from the point of view of knowledge representation and reasoning. The technique of combining Ontology with template rules is proposed, and a template rule representation based on two-side tree structure is proposed for the limitation of linear template representation. At the same time, the hypothesis-conflict resolution reasoning under this representation is realized, which is successfully applied to the information extraction of job advertisements.
【作者单位】: 北京理工大学计算机科学工程系人工智能研究所 北京理工大学计算机科学工程系人工智能研究所 北京理工大学计算机科学工程系人工智能研究所
【分类号】:TP393.03
【正文快照】: 1引言随着Internet的快速发展,Web已经成为跨全球的信息源。使用传统的搜索引擎,,用户要精确地找到所需信息往往十分困难。提高搜索引擎准确性的一个主要途径是使其在某种程度上理解信息源的内容。目前在互联网研究领域兴起的语义Web技术就是朝这个方向进行的努力。语义Web
【相似文献】
相关会议论文 前6条
1 ;Web Information Extraction based on News Domain Ontology Theory[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
2 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 周相兵;;基于Ontology的语义Web服务聚合自动机研究及应用[A];第二十七届中国控制会议论文集[C];2008年
4 赵慧杰;沈建京;;基于OWL的Web服务工作流管理研究[A];2005年中国智能自动化会议论文集[C];2005年
5 ;基于语义的Web服务发现(英文)[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 ;Integrating Semantics and Agent Technology to Automatic Web Service Composition[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
相关重要报纸文章 前4条
1 清华大学计算机系 徐剑军 张钋 李涓子 王克宏;智能化应用的基石[N];计算机世界;2004年
2 本报记者 冯卫东;下一代搜索引擎呼之欲出[N];科技日报;2009年
3 徐志伟;网格的称谓[N];计算机世界;2001年
4 清水 编译;Web 3.0:互联网是你的私人助理[N];计算机世界;2010年
相关博士学位论文 前2条
1 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
2 梁晟;基于语义Web的服务自动组合技术的研究[D];中国科学院研究生院(软件研究所);2004年
相关硕士学位论文 前10条
1 张琳;基于Ontology和XML的非结构化信息语义表示机制研究[D];武汉科技大学;2004年
2 熊毅;基于ontology的内容安全技术研究与实现[D];电子科技大学;2004年
3 张在龙;基于Mobile Agent和ontology的协同工作引擎[D];电子科技大学;2003年
4 赵军;一个基于Ontology的数字权限表达语言的设计与实现[D];东南大学;2004年
5 刘华;基于XML标准的EIP核心技术研究[D];武汉科技大学;2003年
6 张晶;基于RDF、Ontology技术的语义Web应用研究[D];山东师范大学;2004年
7 任涛;基于本体和描述逻辑的Web服务查找技术研究[D];山东大学;2005年
8 周应强;基于本体的Web非规范知识处理中采集技术研究[D];昆明理工大学;2005年
9 王洪磊;基于语义Web的数字图书馆资源语义描述方法研究[D];哈尔滨工程大学;2007年
10 雷强;语义Blog系统研究与设计[D];四川大学;2007年
本文编号:1480862
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1480862.html