面向社会网络应用的关系抽取研究
发布时间:2021-04-08 16:42
自搜索引擎出现至今,大量信息扑面而来,但其中绝大部分均为重复信息。搜索引擎返回了过多的结果却依旧很难找到有用的信息。倘若有一种方法能将检索结果进行有效过滤,只抽取出人们所需要的关键信息,并以网络图的形式,而非仅仅是文字的形式呈现出来的话,则人们获取信息的效率必将会大大提高。基于此,本文针对社会网络领域中命名实体间的关系抽取问题进行了深入研究,尝试构建了一个面向社会网络领域的社会关系本体,在包含两个或两个以上命名实体的句子中抽取出相应的词语作为实体间的关系描述。同时还定义了一系列的SWRL规则,并结合Jess推理引擎对本体中的隐含社会关系进行了挖掘。在命名实体识别任务中,本文主要针对人名和机构名进行识别,借鉴了语义角色标注的思想,采用Viterbi算法,自动标注出句中各分词片段在人名或机构名中所代表的不同角色,同时根据人名和机构名的成词特点,总结出符合条件的构词规则,进行模式匹配,以得出最终的识别结果。本文对真实语料进行了开放测试,实验结果显示,该方法的召回率高于准确率,已接近70%。此结果验证了上述方法的有效性。在关系抽取任务中,本文综合本体工程中的七步法和迭进法,构建了一个面向社会网...
【文章来源】:南京理工大学江苏省 211工程院校
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 引言
1.1 研究背景与意义
1.2 实体关系抽取研究的现状分析
1.2.1 基于模式匹配的关系抽取研究现状
1.2.2 基于机器学习的关系抽取研究现状
1.2.3 基于本体工程的关系抽取研究现状
1.3 本文主要研究内容与实现思路
1.3.1 研究内容
1.3.2 实现思路
1.4 本文所做的工作及其创新点
1.5 本文的组织结构
2 命名实体识别研究
2.1 命名实体识别的难点
2.1.1 中文人名识别的难点及存在的问题
2.1.2 中文机构名识别的难点及存在的问题
2.2 命名实体识别方法的研究现状分析
2.2.1 中文人名识别方法的现状分析
2.2.2 中文机构名识别方法的现状分析
2.2.3 语义角色标注方法的介绍
2.3 命名实体自动识别实验的设计
2.3.1 训练语料的选取
2.3.2 自动分词处理
2.3.3 人名和机构名的角色设置及提取规则
2.3.4 Viterbi算法在角色自动标注中应用
2.4 命名实体自动识别实验
2.4.1 实验过程
2.4.2 实验结果及其结果分析
2.5 本章小结
3 社会关系领域本体的构建
3.1 本体的基本思想及分类
3.1.1 本体基本思想
3.1.2 本体分类
3.2 本体工程
3.2.1 骨架法
3.2.2 企业建模法
3.2.3 七步法
3.2.4 迭进法
3.3 本体表示语言及其构建工具
3.3.1 本体表示语言OWL
3.3.2 本体构建工具Protege
3.4 社会关系本体构建的难点及存在的问题
3.4.1 需求分析困难
3.4.2 构建过程缺乏规范性
3.4.3 没有成熟本体可供借鉴
3.4.4 没有规范的评价标准
3.5 社会关系本体的设计与实现
3.5.1 社会关系本体中类的设置
3.5.2 社会关系本体中属性的设置
3.5.3 社会关系本体中实例的设置
3.6 基于社会关系本体的命名实体间关系自动抽取实验
3.7 本章小结
4 基于SWRL规则推理的隐含关系挖掘研究
4.1 SWRL及其编辑工具
4.1.1 SWRL概述
4.1.2 SWRL编辑工具SWRL Tab
4.2 规则推理引擎Jess
4.2.1 Jess概述
4.2.2 Jess的安装配置
4.3 基于SWRL推理机制的隐含关系挖掘实验
4.3.1 隐含关系挖掘的实现思路
4.3.2 SWRL规则的设计
4.3.3 社会关系本体和SWRL规则到Jess事实库与规则库的转化
4.3.4 运行Jess进行推理
4.3.5 推理后产生新的本体知识
4.4 本章小结
5 总结和展望
5.1 总结
5.2 存在的问题及将来的研究展望
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]基于条件随机场的中文组织机构名识别研究[J]. 周波,蔡东风. 沈阳航空工业学院学报. 2009(01)
[2]基于模板匹配的中文机构名识别[J]. 李军,王丁,王鑫. 信息技术. 2008(06)
[3]基于正反例训练的SVM命名实体关系抽取[J]. 刘路,李弼程,张先飞. 计算机应用. 2008(06)
[4]领域本体的关系抽取研究[J]. 何琳. 现代图书情报技术. 2008(04)
[5]领域本体构建方法[J]. 刘仁宁,李禹生. 武汉工业学院学报. 2008(01)
[6]中文组织机构名称与简称的识别[J]. 沈嘉懿,李芳,徐飞玉,Hans Uszkoreit. 中文信息学报. 2007(06)
[7]一种本体学习中分类关系提取方法的研究[J]. 贾秀玲,文敦伟. 计算机技术与发展. 2007(10)
[8]中文实体关系抽取中的特征选择研究[J]. 董静,孙乐,冯元勇,黄瑞红. 中文信息学报. 2007(04)
[9]用语义模式提取实体关系的方法[J]. 邓擘,樊孝忠,杨立公. 计算机工程. 2007(10)
[10]基于类语言模型的中文机构名称自动识别[J]. 尹继豪,樊孝忠,于江德. 计算机科学. 2006(11)
硕士论文
[1]基于关系数据库的本体自动构建的研究[D]. 唐颖峰.中南大学 2009
[2]基于语义WEB技术的产品配置研究[D]. 伍宏伟.上海交通大学 2009
[3]动画素材的领域本体模型与语义推理研究[D]. 袁小娟.湖南师范大学 2009
[4]中文命名实体识别及其关系抽取研究[D]. 温锐.苏州大学 2005
本文编号:3125889
【文章来源】:南京理工大学江苏省 211工程院校
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 引言
1.1 研究背景与意义
1.2 实体关系抽取研究的现状分析
1.2.1 基于模式匹配的关系抽取研究现状
1.2.2 基于机器学习的关系抽取研究现状
1.2.3 基于本体工程的关系抽取研究现状
1.3 本文主要研究内容与实现思路
1.3.1 研究内容
1.3.2 实现思路
1.4 本文所做的工作及其创新点
1.5 本文的组织结构
2 命名实体识别研究
2.1 命名实体识别的难点
2.1.1 中文人名识别的难点及存在的问题
2.1.2 中文机构名识别的难点及存在的问题
2.2 命名实体识别方法的研究现状分析
2.2.1 中文人名识别方法的现状分析
2.2.2 中文机构名识别方法的现状分析
2.2.3 语义角色标注方法的介绍
2.3 命名实体自动识别实验的设计
2.3.1 训练语料的选取
2.3.2 自动分词处理
2.3.3 人名和机构名的角色设置及提取规则
2.3.4 Viterbi算法在角色自动标注中应用
2.4 命名实体自动识别实验
2.4.1 实验过程
2.4.2 实验结果及其结果分析
2.5 本章小结
3 社会关系领域本体的构建
3.1 本体的基本思想及分类
3.1.1 本体基本思想
3.1.2 本体分类
3.2 本体工程
3.2.1 骨架法
3.2.2 企业建模法
3.2.3 七步法
3.2.4 迭进法
3.3 本体表示语言及其构建工具
3.3.1 本体表示语言OWL
3.3.2 本体构建工具Protege
3.4 社会关系本体构建的难点及存在的问题
3.4.1 需求分析困难
3.4.2 构建过程缺乏规范性
3.4.3 没有成熟本体可供借鉴
3.4.4 没有规范的评价标准
3.5 社会关系本体的设计与实现
3.5.1 社会关系本体中类的设置
3.5.2 社会关系本体中属性的设置
3.5.3 社会关系本体中实例的设置
3.6 基于社会关系本体的命名实体间关系自动抽取实验
3.7 本章小结
4 基于SWRL规则推理的隐含关系挖掘研究
4.1 SWRL及其编辑工具
4.1.1 SWRL概述
4.1.2 SWRL编辑工具SWRL Tab
4.2 规则推理引擎Jess
4.2.1 Jess概述
4.2.2 Jess的安装配置
4.3 基于SWRL推理机制的隐含关系挖掘实验
4.3.1 隐含关系挖掘的实现思路
4.3.2 SWRL规则的设计
4.3.3 社会关系本体和SWRL规则到Jess事实库与规则库的转化
4.3.4 运行Jess进行推理
4.3.5 推理后产生新的本体知识
4.4 本章小结
5 总结和展望
5.1 总结
5.2 存在的问题及将来的研究展望
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]基于条件随机场的中文组织机构名识别研究[J]. 周波,蔡东风. 沈阳航空工业学院学报. 2009(01)
[2]基于模板匹配的中文机构名识别[J]. 李军,王丁,王鑫. 信息技术. 2008(06)
[3]基于正反例训练的SVM命名实体关系抽取[J]. 刘路,李弼程,张先飞. 计算机应用. 2008(06)
[4]领域本体的关系抽取研究[J]. 何琳. 现代图书情报技术. 2008(04)
[5]领域本体构建方法[J]. 刘仁宁,李禹生. 武汉工业学院学报. 2008(01)
[6]中文组织机构名称与简称的识别[J]. 沈嘉懿,李芳,徐飞玉,Hans Uszkoreit. 中文信息学报. 2007(06)
[7]一种本体学习中分类关系提取方法的研究[J]. 贾秀玲,文敦伟. 计算机技术与发展. 2007(10)
[8]中文实体关系抽取中的特征选择研究[J]. 董静,孙乐,冯元勇,黄瑞红. 中文信息学报. 2007(04)
[9]用语义模式提取实体关系的方法[J]. 邓擘,樊孝忠,杨立公. 计算机工程. 2007(10)
[10]基于类语言模型的中文机构名称自动识别[J]. 尹继豪,樊孝忠,于江德. 计算机科学. 2006(11)
硕士论文
[1]基于关系数据库的本体自动构建的研究[D]. 唐颖峰.中南大学 2009
[2]基于语义WEB技术的产品配置研究[D]. 伍宏伟.上海交通大学 2009
[3]动画素材的领域本体模型与语义推理研究[D]. 袁小娟.湖南师范大学 2009
[4]中文命名实体识别及其关系抽取研究[D]. 温锐.苏州大学 2005
本文编号:3125889
本文链接:https://www.wllwen.com/tushudanganlunwen/3125889.html