基于跨事件的新闻事件因果关系识别方法研究
本文选题:因果关系 + 新闻事件 ; 参考:《昆明理工大学》2017年硕士论文
【摘要】:信息抽取近年来一直受到国内外学者的广泛,国际上专门设立了 ACE评测会议来促进该领域的发展。事件关系是信息抽取中非常有意义的研究内容,主要包括事件时序关系、事件因果关系等。新闻事件因果关系可以帮助人们很好地理解新闻,把握新闻事件演变规律。在信息抽取,特别是自动问答系统有着广泛的应用前景。因此,新闻事件因果关系识别研究也成为一个热门研究点。现有的事件因果关系识别主要利用当前事件对的局部信息进行识别,识别效果不高,对于新闻报道中包含的其他信息没有进行充分运用。本文将引入跨事件方法对新闻事件因果关系进行识别,当局部信息不足以识别因果关系时,积极寻找新闻报道中的其他信息进行辅助识别。语料库是机器学习算法的基础。本文使用ACE2005会议提供的中文评测语料,该语料已经对实体、关系和事件进行了标注。本文针对该语料库进行了详细地分析,特别是与因果关系识别任务相结合的部分。围绕着语料库构建、融合跨事件方法的新闻事件因果关系识别展开了研究,主要完成了以下研究工作:(1)新闻事件因果关系语料库构建。在分析了 ACE2005中文语料库的特点以及新闻事件因果关系识别的实际需要的基础上对语料进行了事件要素抽取,如事件类型、事件极性、事件泛型、事件触发词、事件触发词词性等事件要素属性,并组织人员对语料进行事件因果关系标注。最终将标注的结果进行了存储,构建了新闻事件因果关系语料库。(2)基于跨事件的新闻事件因果关系识别。本文将跨事件方法引入到事件因果关系识别任务中来,选择特征空间构造最大熵分类器,进行句子级别的因果关系识别。设定阈值,对于获得的概率值高于阈值的,直接采用分类的结果;同时构建文档级别的分类器来进一步处理低概率的部分。(3)整合了上述两个的研究成果,设计并实现了新闻事件因果关系识别原型系统。
[Abstract]:In recent years, information extraction has been widely used by scholars at home and abroad. International ACE evaluation conferences have been set up to promote the development of this field. Event relation is a very meaningful research content in information extraction, including event temporal relation, event causality and so on. News event causality can help people to understand news and grasp the law of news event evolution. It is widely used in information extraction, especially in automatic question answering system. Therefore, news event causality recognition has become a hot research point. The existing event causality recognition mainly uses the local information of the current event to identify, the recognition effect is not high, and the other information contained in the news report is not fully utilized. In this paper, cross-event method is introduced to identify the causality of news events. When local information is not sufficient to identify causality, we will actively seek other information in news reports for auxiliary identification. Corpus is the foundation of machine learning algorithm. This paper uses the Chinese evaluation corpus provided by the ACE2005 Conference, which has annotated entities, relationships, and events. In this paper, the corpus is analyzed in detail, especially the part combined with causality recognition. This paper focuses on the construction of corpus and the identification of news event causality based on cross-event method. The following research work is completed: 1) Construction of news event causality corpus. On the basis of analyzing the characteristics of ACE2005 Chinese corpus and the actual needs of news event causality identification, the paper extracts the event elements of the corpus, such as event type, event polarity, event generality, event trigger word. Event trigger words, such as event attribute, are organized to annotate event causality. Finally, the annotated results are stored and the news event causality corpus. 2) based on the cross-event identification of news event causality. In this paper, the cross-event method is introduced into the task of event causality recognition, and the maximum entropy classifier is constructed in the feature space to identify the causal relationship at sentence level. Setting a threshold, directly using the results of classification for those whose probabilities are higher than the threshold, and constructing a document-level classifier to further deal with the low-probabilistic part. The prototype system of news event causality recognition is designed and implemented.
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1
【参考文献】
相关期刊论文 前10条
1 黄一龙;李培峰;朱巧明;;中文事件相关性语料库构建及识别方法[J];计算机工程与科学;2015年12期
2 郭喜跃;何婷婷;;信息抽取研究综述[J];计算机科学;2015年02期
3 王强;陈安琪;;突发公共卫生事件语料库研究[J];安全;2015年01期
4 钟军;禹龙;田生伟;吐尔根·依布拉音;;基于双层模型的维吾尔语突发事件因果关系抽取[J];自动化学报;2014年04期
5 曹媛;朱巧明;李培峰;;中文事件事实性信息语料库的构建方法[J];中文信息学报;2013年06期
6 侯立斌;李培峰;朱巧明;;基于CRFs和跨事件的事件识别研究[J];计算机工程;2012年24期
7 刘永彬;杨炳儒;李广源;刘英华;;基于马尔可夫逻辑网的联合推理开放信息抽取[J];计算机科学;2012年09期
8 侯立斌;李培峰;朱巧明;钱培德;;基于跨事件理论的缺失事件角色填充研究[J];计算机科学;2012年07期
9 付剑锋;刘宗田;刘炜;周文;;基于层叠条件随机场的事件因果关系抽取[J];模式识别与人工智能;2011年04期
10 李悦群;毛文吉;王飞跃;;面向领域开源文本的因果知识提取[J];计算机工程与科学;2010年05期
相关会议论文 前1条
1 杨丽英;李红娟;张永奎;;突发事件新闻语料分类体系研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
相关博士学位论文 前2条
1 裘江南;汉语文本中突发事件因果关系抽取方法研究[D];大连理工大学;2012年
2 干红华;基于事件的因果关系可计算化分析研究[D];浙江大学;2003年
相关硕士学位论文 前5条
1 郑新;中文事件时序关系识别与推理方法研究[D];苏州大学;2015年
2 潘清清;越南语新闻事件元素抽取方法研究[D];昆明理工大学;2014年
3 宋原;中文句间关系识别及其应用研究[D];哈尔滨工业大学;2013年
4 孙辉;事件时序关系识别的研究与实现[D];哈尔滨工业大学;2010年
5 丁小杉;基于句子的因果关系识别[D];上海交通大学;2010年
,本文编号:1839590
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1839590.html