因果关系知识库的研究与构建
发布时间:2017-04-11 07:03
本文关键词:因果关系知识库的研究与构建,,由笔耕文化传播整理发布。
【摘要】:互联网技术突飞猛进的发展,不断地推动着人类思维方式的变革;数据的爆炸式增长,不断地改变着二进制世界的格局。现今数据信息的如此高速膨胀,已使我们进入了大数据时代,数据信息已成为各行各业掌握行业命脉的要点,因此由数据驱动的信息技术革命正以前所未有的方式颠覆着人类的生活。数据和信息之间是相互联系的,数据经过挖掘、加工处理之后,就能成为人们所需要的信息。大数据时代,数据中蕴藏着巨大的价值,从海量数据中提取有用信息,识别其中蕴藏的模式、规律和相关关系,是人类认识世界的新方式。社会化媒体上人们日常行为和情感的陈述中蕴藏着大量的生活经验总结,其中包括大量的常识性因果关系。大数据背景下,根据已有经验知识从文本数据中识别事物间的因果联系,归纳出事物间固有的因果关系,构建成因果关系知识库(因果关系网)。将人们生活中依靠常识性思维判断的知识被计算机系统的预测功能所取代,甚至推理出由人类思维所无法达到的深层因果关系,使人们进一步明确事物间的引起与被引起作用,有利把控事物间的不利影响。本文提出了句内因果关系的提取方法,在汉语言文学知识的基础上,利用因果关系提示词识别含有显示因果关系的因果句;根据汉语语法结构和句法依存关系归纳出相应的句法模式匹配规则,进行因果关系实体对的识别;同时根据句内包含的程度副词、情感词、否定词和句法模式规则确定实体间的因果强度;根据词语语义相似性,对因果关系实体对进行语义相似性融合,形成因果关系实体集合对;同时计算因果实体对的共现频率得到因果关系支持度;形成事物间因果关系的知识库。针对文本中因果关系的提取,本论文提出如下创新:(1)提取句中的情感词、级性词、否定词,分析何种程度的原因部分对结果部分造成多大的影响,即计算因果关系强度;(2)通过计算因果关系实体对在数据源中的共现频率,计算因果关系支持度;(3)将因果关系实体对基于语义相似性进行聚类操作,将因果关系数据转化为因果知识。
【关键词】:因果关系 因果强度 数据挖掘 朴素贝叶斯 知识库
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-6
- Abstract6-11
- 第1章 绪论11-16
- 1.1 研究背景与意义11-12
- 1.2 相关研究现状12-13
- 1.3 主要研究内容13-14
- 1.4 论文结构14-15
- 1.5 本章小结15-16
- 第2章 相关技术概述16-25
- 2.1 关联和相关性分析16-18
- 2.1.1 关联规则16-17
- 2.1.2 挖掘频繁项集17
- 2.1.3 关联规则模式评估方法17-18
- 2.2 词语相似度18-24
- 2.2.1 基于语义的词语相似性计算19-21
- 2.2.2 基于统计的词语相似性计算21-24
- 2.3 本章小结24-25
- 第3章 因果关系识别25-36
- 3.1 显式因果关系25-28
- 3.1.1 因果关系表示形式25-26
- 3.1.2 汉语中的因果关系词26-27
- 3.1.3 因果关系表达结构分析27-28
- 3.2 文本中因果关系模式归纳28-34
- 3.2.1 连词对应的句法模式28-30
- 3.2.2 动词对应的句法模式30-32
- 3.2.3 介词对应的句法模式32
- 3.2.4 副词对应的句法模式32-33
- 3.2.5 明确因果与模糊因果分类33-34
- 3.3 隐式因果关系34-35
- 3.4 本章小结35-36
- 第4章 因果关系知识库的构建36-50
- 4.1 因果关系分类36-37
- 4.2 显式因果关系抽取37-46
- 4.2.1 因果关系抽取框架37
- 4.2.2 文本数据预处理37-40
- 4.2.3 因果关系实体对抽取40-44
- 4.2.4 因果关系支持度研究44-46
- 4.3 因果关系知识库构建46-49
- 4.4 本章小结49-50
- 第5章 实验与总结50-55
- 5.1 实验50-53
- 5.1.1 实验背景50-51
- 5.1.2 因果句法模式实验分析51
- 5.1.3 因果关系提取实验分析51-52
- 5.1.4 因果关系知识库分析52-53
- 5.2 总结与展望53-55
- 5.2.1 深层因果关系的识别53
- 5.2.2 模糊因果关系的判定及隐式因果关系的识别53
- 5.2.3 因果关系实体对的识别53-54
- 5.2.4 因果关系评价策略54-55
- 参考文献55-57
- 致谢57
【参考文献】
中国期刊全文数据库 前10条
1 赵森栋;刘挺;;因果关系及其在社会媒体上的应用研究综述[J];软件学报;2014年12期
2 詹志建;梁丽娜;杨小平;;基于百度百科的词语相似度计算[J];计算机科学;2013年06期
3 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
4 崔阳;杨炳儒;;知识发现中的因果关联规则挖掘研究[J];计算机工程与应用;2009年31期
5 储泽祥;陶伏平;;汉语因果复句的关联标记模式与“联系项居中原则”[J];中国语文;2008年05期
6 许文胜;张柏然;;基于英汉名著语料库的因果关系连词对比研究[J];外语教学与研究;2006年04期
7 彭湃;现代汉语因果关系连接成分研究综述[J];汉语学习;2004年02期
8 王锵,石纯一;一种因果推理形式[J];软件学报;1997年04期
9 张学成;论复句语义的三种关系[J];杭州师范学院学报;1992年04期
10 王维贤;;句法分析的三个平面与深层结构[J];语文研究;1991年04期
中国博士学位论文全文数据库 前1条
1 裘江南;汉语文本中突发事件因果关系抽取方法研究[D];大连理工大学;2012年
本文关键词:因果关系知识库的研究与构建,由笔耕文化传播整理发布。
本文编号:298545
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/298545.html