面向突发事件案例库的事件抽取模型构建研究
发布时间:2017-10-05 11:29
本文关键词:面向突发事件案例库的事件抽取模型构建研究
更多相关文章: 突发事件 事件抽取 事件框架 案例表示 信息抽取
【摘要】:近年来世界各地突发事件频繁发生,给人类社会的安全和发展造成了巨大的威胁,引起了国内外学者和政府部门的高度关注。与一般事件相比,由于突发事件具有突然发生的特点,往往存在信息上的匮乏,从而导致决策依据不足、决策风险性加大、事件处理难度增加等问题。对突发事件信息进行结构化抽取,建立突发事件典型案例库是提升突发事件应对能力的有效手段。因而,构建面向突发事件案例库的事件抽取模型实现案例信息的自动化抽取对于突发事件的应急决策具有十分重要的意义。为了使抽取模型能够更好地适用于构建突发事件案例库,本文首先对突发事件案例信息抽取过程中涉及到的突发事件案例信息、突发事件和突发事件抽取框架等问题进行界定:提出一个描述突发事件案例的四元特征向量模型,从案例类型、案例描述、解决方案、决策环境等方面对突发事件进行描述;根据突发事件类型的不同在每个特征维度下对事件要素分别进行确定;同时,基于这一特征向量模型构建带有继承机制的突发事件案例信息的抽取框架;然后针对抽取框架的不同侧面的特点,将侧面分为事件时间、事件地点、事件其他侧面三类,并分别对每一类信息的抽取方法和模式进行详细说明,具体为:1)时间类。根据突发事件相关文本中时间表达式的形态特点,提出基本时间要素概念,用来代指时间表达式中的基本组成成分。并对基本时间要素的匹配模式和组合规则进行总结和说明;针对时间表达式的标准化问题提出非数值时间数值化策略和时间块、模糊时间的数值化转换规则;利用时间文档位置、时间重要性等特征对事件的发生时间进行推断。2)地点类。针对突发事件相关文本分词后地理信息领域名词误识别、外国地名识别率低的特点,建立附加的领域词典、地名词典;针对地名语块识别能力不足等问题,提出基本地理要素概念,并对基本地理要素的抽取模式和组合规则进行总结和定义;针对地名的规范化问题建立地名数据库、地名-简称对照表,提出地名指代词消解策略;利用地点信息文档位置、地点信息重要性、地点信息关系等特征对事件的发生地点进行推断。3)其他侧面类。根据事件其他侧面与元事件的关系,将事件其他侧面的抽取转化为元事件的抽取,并对要抽取元事件类型进行定义。采用基于扩展触发词和知网语义相似度计算的候选事件抽取方法,根据不同侧面的特点分别采用基于模式和基于语义角色标注的方法对不同侧面进行抽取。4)事件归并。以地理信息和时间信息为特征,提出一种多文档环境下事件的归并判别方法和归并规则。经过在公共卫生类突发事件语料上进行实验,结果表明本文提出的抽取模型是可行的,对于突发事件要素抽取达到较高的准确率和召回率。
【关键词】:突发事件 事件抽取 事件框架 案例表示 信息抽取
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:D035.2;G254
【目录】:
- 中文摘要5-7
- Abstract7-11
- 1 绪论11-15
- 1.1 研究的背景和意义11
- 1.2 研究内容和方法11-13
- 1.2.1 研究内容11-12
- 1.2.2 研究方法12-13
- 1.3 本文组织结构13-15
- 2 突发事件抽取相关工作介绍15-26
- 2.1 事件抽取方法介绍15-22
- 2.1.1 元事件抽取方法介绍15-19
- 2.1.2 主题事件抽取方法介绍19-22
- 2.2 事件抽取测评会议介绍22-25
- 2.2.1 MUC测评会议22-23
- 2.2.2 ACE测评会议23-25
- 2.3 突发事件抽取进展介绍25-26
- 3 基于框架的突发事件抽取模型构建26-53
- 3.1 突发事件信息抽取中的概念定义和介绍26-32
- 3.1.1 突发事件案例信息的定义26-28
- 3.1.2 事件定义和抽取框架定义28-32
- 3.2 事件时间的抽取32-40
- 3.2.1 时间元素识别32-34
- 3.2.2 时间元素标准化34-37
- 3.2.3 报道时间的抽取37-38
- 3.2.4 事件发生时间推断38-40
- 3.3 事件地点的抽取40-45
- 3.3.1 地点元素识别40-42
- 3.3.2 地名规范化42-43
- 3.3.3 事件发生地点推断43-45
- 3.4 其他信息要素的抽取45-51
- 3.4.1 元事件的识别过程说明46-48
- 3.4.2 事件元素的抽取48-51
- 3.5 事件的归并51-53
- 3.5.1 事件归并判断51
- 3.5.2 事件归并规则51-53
- 4 实验53-59
- 4.1 准备工作说明53-55
- 4.2 评价指标说明55
- 4.3 实验结果和分析55-57
- 4.4 对比实验57-59
- 5 总结和展望59-61
- 5.1 工作总结59
- 5.2 不足和展望59-61
- 参考文献61-67
- 致谢67-68
【参考文献】
中国期刊全文数据库 前4条
1 牛之贤;白鹏洲;段富;;基于框架语义标注的自由文本信息抽取研究[J];计算机工程与应用;2008年25期
2 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
3 丁效;宋凡;秦兵;刘挺;;音乐领域典型事件抽取方法研究[J];中文信息学报;2011年02期
4 高强;游宏梁;;事件抽取技术研究综述[J];情报理论与实践;2013年04期
,本文编号:976547
本文链接:https://www.wllwen.com/tushudanganlunwen/976547.html
教材专著