简单本体在实用信息抽取中的使用及针对实用本体的高级信息抽取
发布时间:2017-11-11 22:07
本文关键词:简单本体在实用信息抽取中的使用及针对实用本体的高级信息抽取
【摘要】:信息抽取是用来理解自然语言文本语义的一种非常实用的方法。而本体则对知识(例如实体和概念间的关系)的定义与建模起重要作用。因此本体经常被用来定义信息抽取任务。高级信息抽取技术,例如复杂的多元关系抽取,可用于学习语言模板,进而从自然文本中识别出本体定义的关系,并抽取出这些关系的实例。本文将描述一个为信息抽取任务而设计的本体模型,以及一个关系抽取的框架系统——DARE。DARE使用了机器学习方法,可以自动学习关系抽取的语言模板,并应用这些模板来抽取关系实例。DARE系统已被深度应用于英语文本的关系抽取。本文将进一步使用DARE来处理中文新闻文本,从中学习语言模板和抽取关系实例,并与英文处理的结果进行比较。
【作者单位】: 德国人工智能研究中心;
【分类号】:H03
【正文快照】: 1.概述本体(ontology)在信息技术中起着组织与分类知识和信息的关键作用。在本体的各类应用中,最具潜在价值的是语义网络(semantic web),一个利于语义访问的结构化万维网(Berners-Lee1999)。另一方面,信息抽取(information ex-traction)技术旨在从自然语言文本中抽取结构化的
【相似文献】
中国重要会议论文全文数据库 前1条
1 虞欢欢;陈九昌;钱龙华;周国栋;;基于树核函数的中文语义关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
,本文编号:1173060
本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/1173060.html