基于知识图谱的跨语言实体链接与语义查询
本文关键词:基于知识图谱的跨语言实体链接与语义查询,由笔耕文化传播整理发布。
【摘要】:近些年,数据的关联语义信息受到人们的普遍关注,语义查询技术取得了长足进步。知识图谱作为语义查询的重要支撑,包含大量命名实体及语义关系,提供开放的知识访问接口,能够一定程度反映真实世界的实体间关系。相比于YAGO、 Probase等具有丰富实体和语义关系的英文知识图谱,中文知识图谱仍处于发展阶段,实体及实体间关系不丰富,难以有效支持中文语义查询。一个很自然的问题是,如何利用成熟的英文知识图谱对中文数据进行语义查询。本文提出一个基于跨语言图谱的跨语言查询框架,并基于图模型完善跨语言图谱的结构语义信息,设计并实现了跨语言查询应用系统,提供在线的跨语言查询服务。基于实际百科数据进行测试,测试结果验证了本文提出的跨语言查询框架的有效性。本文的主要贡献包括以下四点·提出跨语言图谱概念与基于跨语言图谱的跨语言查询框架。该框架在线解决存在未知跨语言链接的中文实体提及查询问题和实体消歧结果重排序问题,实现准确的跨语言语义查询。·提出一种分类-排序模型与基于关系图的随机游走算法,解决中英文Wiki-Sketch(关键百科)之间跨语言属性标签链接、属性缺失语义发现、错误链接属性识别、缺失属性补全等关键问题。Wiki-Sketch是抽取自百科数据的面向程序的、结构化的实体集。·提出一种结合跨语言实体链接,以及跨语言属性标签链接的缺失属性补全方法,补充了中文维基百科80,566个实体的347,124条缺失信息框属性,以及60万中英文维基实体的4,500多万条缺失链接属性。·设计并实现了跨语言语义查询系统,在线提供并支持多种客户端的近实时访问。借助用户查询历史和用户反馈,实现查询的自适优化,提高查询准确性。本文从跨语言查询框架的构建、跨语言图谱结构语义信息完善、跨语言查询系统效果提升三个方面开展研究,实现了中文实体的跨语言语义查询,对中文语义信息挖掘与补全有重要意义。
【关键词】:知识图谱 实体链接 实体消歧 语义查询 跨语言实体链接
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要6-7
- ABSTRACT7-12
- 第一章 绪论12-18
- 1.1 研究背景12-13
- 1.2 研究问题13-15
- 1.3 主要贡献15-17
- 1.4 组织结构17-18
- 第二章 相关工作18-24
- 2.1 知识图谱18-20
- 2.2 实体链接20-23
- 2.2.1 单语言实体链接20-22
- 2.2.2 跨语言实体链接22-23
- 2.3 本章小结23-24
- 第三章 基于跨语言图谱的跨语言实体查询24-46
- 3.1 概念描述24-25
- 3.2 查询处理框架25-27
- 3.3 离线知识获取27-30
- 3.3.1 词典抽取27-30
- 3.3.2 Wiki-Sketch与同义词集抽取30
- 3.4 中文实体链接30-32
- 3.5 跨语言实体链接32-37
- 3.5.1 结构特征抽取33-36
- 3.5.2 语义特征抽取36-37
- 3.5.3 跨语言链接实体发现37
- 3.6 关系子图生成37-40
- 3.7 实验40-44
- 3.7.1 实验设置40-41
- 3.7.2 准确性实验41-44
- 3.8 本章小结44-46
- 第四章 跨语言图谱结构语义信息完善46-66
- 4.1 数据观察47-48
- 4.2 跨语言图谱完善框架48
- 4.3 跨语言属性标签链接48-51
- 4.3.1 跨语言属性标签预分类50-51
- 4.3.2 跨语言标签链接预测51
- 4.4 错误属性识别51-58
- 4.4.1 ILG图构建52-54
- 4.4.2 错误跨语言链接识别54-58
- 4.5 缺失属性补全58-60
- 4.5.1 缺失信息框属性补全58-59
- 4.5.2 缺失链接属性补全59-60
- 4.6 实验60-65
- 4.6.1 数据集60-61
- 4.6.2 准确性实验61-62
- 4.6.3 缺失属性分析62-65
- 4.7 本章小结65-66
- 第五章 跨语言实体查询系统66-74
- 5.1 系统架构66-67
- 5.2 查询准确率优化67-68
- 5.3 近实时性查询68-69
- 5.4 可视化展示69-71
- 5.5 实验71-72
- 5.5.1 实验设置71
- 5.5.2 实验分析71-72
- 5.6 本章小结72-74
- 第六章 总结与展望74-77
- 6.1 总结74-75
- 6.2 展望75-77
- 参考文献77-88
- 致谢88-90
- 攻读硕士学位期间发表论文和科研情况90
【相似文献】
中国期刊全文数据库 前10条
1 徐福缘;对IDEF1的扩充[J];计算机工程;1988年05期
2 李天柱;O-O数据模型中实体联系的表达方法[J];计算机研究与发展;1997年04期
3 杨丹;申德荣;于戈;聂铁铮;寇月;;数据空间中时间为中心的集合实体识别策略[J];计算机科学与探索;2012年11期
4 刘军华;张丽敏;;基于数据字典的实体类设计与实现[J];湖南工业职业技术学院学报;2012年05期
5 闫宝华;;信息管理系统中实体bean问题之解决方案研究[J];网络安全技术与应用;2011年01期
6 朱立;;浅谈实体框架[J];电脑知识与技术;2011年18期
7 朱晓林;;基于Java创建游戏实体类[J];科技广场;2006年05期
8 刘杰;;基于规则和统计相结合的地名实体识别的研究[J];佳木斯大学学报(自然科学版);2009年04期
9 李金良,陈恩平;集成CAD/CAPP的制造资源扩展实体联系模型[J];组合机床与自动化加工技术;2001年11期
10 郭景峰;王春燕;邹晓红;赵鹏飞;张健;;一种改进的针对合著关系网络的链接预测方法[J];计算机科学;2008年12期
中国博士学位论文全文数据库 前5条
1 王金刚;在线知识库累积引文推荐技术研究[D];北京理工大学;2015年
2 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
3 姜丽丽;实体搜索与实体解析方法研究[D];兰州大学;2012年
4 张俊三;Web中相关实体发现研究[D];北京交通大学;2013年
5 毛存礼;有色金属领域实体检索关键技术研究[D];昆明理工大学;2014年
中国硕士学位论文全文数据库 前10条
1 郭云龙;微博实体与百科条目链接的多策略研究[D];西南大学;2015年
2 吴佳君;多阶段混合属性的景点实体解析研究[D];江西师范大学;2015年
3 王睿;实体链接的研究与实现[D];北京邮电大学;2015年
4 王福海;贵阳学院学生公寓管理系统的研究与分析[D];云南大学;2015年
5 苏永浩;基于知识图谱的跨语言实体链接与语义查询[D];华东师范大学;2016年
6 霍然;量质融合数据管理系统中实体识别子系统的研究与实现[D];哈尔滨工业大学;2013年
7 张蕊;Deep Web环境下重名实体识别研究[D];东北大学;2010年
8 刘璇;普适计算环境下实体发现机制的研究与实现[D];国防科学技术大学;2008年
9 于晓;Deep Web查询松弛和实体识别研究[D];辽宁大学;2012年
10 王兆昭;面向校园对象的实体搜索和社会化搜索系统的研究、设计和实现[D];北京邮电大学;2014年
本文关键词:基于知识图谱的跨语言实体链接与语义查询,由笔耕文化传播整理发布。
,本文编号:321681
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/321681.html