当前位置:主页 > 社科论文 > 哲学论文 >

多类型数据的事件因果关系研究

发布时间:2019-07-21 11:38
【摘要】:因果关系的研究在于揭示自然和人类社会发展的本质及其规律,以解释现象、控制存在、预测未来,对人类长久以来的生产生活和科学研究有着非常重要的作用。数值数据和时事文本的事件因果关系研究,将因果关系实体的每一次发生看作是一个事件,利用计算科学领域的知识和技术,通过分析处理不同研究领域的数值数据或新闻报道等文本数据,以获取医学、经济、政治、军事、环境、科技等领域发生的事件间的因果关系,实现对热点目标事件或目标变量的因果分析和预测。该研究将计算科学应用于时政分析领域,将因果关系研究引入文本挖掘,为因果关系研究提供了一个新的研究思路。目前,因果关系的研究受到前所未有的广泛关注,但仍存在诸多困难和挑战。至今人们对因果关系的认识仍存在不足甚至谬误,因果关系问题本身及问题环境都十分复杂。由于环境、人为因素的复杂多变并且不可控,真实环境下的因果关系发现更具挑战性。而现有的因果发现、推理算法复杂,算法性能受限于计算能力和具体应用领域,真实复杂环境下的算法性能评估更加困难。针对以上问题,我们对因果关系进行了系统性研究,涉及因果关系的本质、性质及其分类、因果作用的物理机制、要素、生命周期以及初始变量等问题,以及因果关系发现和预测方法。基于这些研究和Pearl等人开创的因果关系经典理论和方法,我们提出了性能更高、鲁棒性更强的用于多类型数值数据系统的事件因果关系的研究框架(ICIC_Framework)、因果关系发现方法(ICIC_Discovery)、分析方法(ICIC_Analysis)、预测方法(ICIC_Prediction)和验证方法。其中事件因果关系发现方法ICIC_Discovery无需预先设定因果结构(如设定为无圈结构),利用初始变量和初始团树,在判定边和方向之前对变量进行粗略地排序,提高了因果关系网络发现性能。ICIC_Discovery方法不仅在理论上具有有效性、稳定性,在多数据集、多评估体系下与多种已有方法比较同样具有优越的性能。本文提出的事件因果关系分析方法ICIC_Analysis利用ICIC_Discovery发现的全局或局部网络,通过为多类型数值数据系统建立事件因果激励/抑制模型、分析系统的原因合作竞争机制、因果演化机制以及隐含变量结构等,以抽象地表示和解释系统的因果作用机制,为事件因果关系预测获取了更多有用信息。本文提出的事件因果关系预测方法ICIC_Prediction不同于以往仅利用马尔科夫毯来预测目标事件的模式,而是综合以上因果发现与分析的结果和结论,从当前数值系统的全局特性出发,利用当前采样数据预测目标事件的发生。本文研究了时事文本的事件因果预测分析,涉及了因果关系研究、数据挖掘、时政分析等的多学科交叉领域。时事文本的事件因果关系研究通常面临极其复杂的真实环境的挑战,时事事件涉及领域广泛,数据稀疏。本文提出的时事文本的事件因果关系预测方法ICIC_Prediction_NewsEvent利用自然语言处理工具提取文本中的时间、地点、事件、涉及人物或机构组织等关键信息,并将这些信息编码为因果关系发现方法可以处理的地点、事件和人物组织三类数值序列。这些由真实环境的文本序列转换而来的数值序列往往非常稀疏,我们将时事文本的关键信息按同义词和近义词聚类为不同的事件类,以此克服稀疏导致的概率失效问题。计算得到事件类之间的因果关系后,按时间、地点等信息进行过滤和排序以获得具体事件的因果关系结构。在已有因果关系结构上,ICIC_Prediction_NewsEvent根据历史数据和当前时间、地点等环境信息来预测某类事件的发生。维基百科年度事件数据集上的实验表明,ICIC_Prediction_NewsEvent方法具备一定的时事事件自动预测能力。真实复杂环境下的因果关系研究方法和结果的评估验证是一个非常困难和迫切需要解决的问题。目前已有的评估指标和数据集大多针对实验室的模拟数据,领域局限性大、费用昂贵,对未知领域的方法和结果评估缺乏指导性。针对这些问题,本文采用了理论分析、实验对比和事实验证相结合的评估方法,以验证ICIC方法在因果关系研究领域中的多项性能。本文从理论和实验上论证了ICIC_Discovery方法的有效性和稳定性,通过实验结果分析,展示了ICIC_Anaylsis和ICIC_Prediction方法的优势和特点,并利用人工标注的时事文本的事件因果关系语料,综合评估分析ICIC_Predition_NewsEvent方法在时事研究领域数据集上性能。本文的比较实验利用来自实验室环境和真实环境下的大规模数据做为实验数据集,对本文提出的方法与多种经典方法进行实验结果和算法复杂度的对比,使得评估验证更加充分。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:B025.5


本文编号:2517155

资料下载
论文发表

本文链接:https://www.wllwen.com/zhexuezongjiaolunwen/2517155.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a09a0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com