基于中文百科的知识图谱分类体系构建研究
本文关键词:基于中文百科的知识图谱分类体系构建研究
【摘要】:分类体系作为知识图谱的骨干组成部分,对整个知识图谱的易用性和连通性具有起到决定性的作用。随着知识图谱应用的日益广泛,国内外都不断涌现出优秀的知识图谱项目。如何为知识图谱构建分类体系,是亟需解决的问题,这是一个非常有意义和挑战的问题。在文中,我们提出了一套完善的为中文百科知识图谱构建分类体系的方法。我们以百科词条为实体,从百科页面中抽取了词条的相关信息,并把词条的信息结构化为特征。我们从百科自有分类树和词条的分类标签中抽取出了类目词条,并根据实体词条和类目词条之间的关联为类目生成了结构化特征。为了获得分类体系中的subclass-of关系,我们采用了支持向量机模型(SVM)。首先构造出两个类目之间的相关性特征作为输入,用人工标注的数据训练好的模型之后,再用模型判断两个类目之间是否存在subclass-of关系。对与instance-of关系的判断,我们在加入subclass-of关系制约的基础上还提出了两种整数规划的方法。整数规划的方法除了考虑直接的instance-of关系特征外,还考虑到了类目之间的关联结构。我们通过实验证明了我们的方法在解决实际问题上获得了令人满意的结果。最后我们还尝试了把整个分类体系构建算法放到迭代模型当中。在整个迭代的过程中,我们利用了subclass-of关系和instance-of关系的传递性,使得它们之间能够相互制约同时相互提升。通过实验数据,我们看到整个迭代模型达到了预期的效果,可以在此基础上进行后续的研究。
【关键词】:分类体系 知识图谱 整数规划
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-5
- Abstract5-11
- 第1章 绪论11-15
- 1.1 课题背景11-12
- 1.2 本文的研究工作12-13
- 1.3 本文的组织结构13-14
- 1.4 本章小结14-15
- 第2章 国内外研究现状15-22
- 2.1 概述15-16
- 2.2 实体和类目的区别16-17
- 2.3 基于规则的is-a关系挖掘17-18
- 2.4 基于机器学习的is-a关系挖掘18-19
- 2.5 国内外知识图谱的分类体系构建研究19-21
- 2.5.1 DBpedia19-20
- 2.5.2 YAGO20
- 2.5.3 Zhishi.me20
- 2.5.4 XLore20-21
- 2.5.5 知识魔方21
- 2.6 本章小结21-22
- 第3章 分类体系的上层构建22-33
- 3.1 实体的抽取和结构化22-23
- 3.2 类目的抽取和结构化23-24
- 3.3 Subclass-of关系判断24-29
- 3.3.1 Subclass-of关系备选集生成24-25
- 3.3.2 支持向量机分类器25-27
- 3.3.3 实验评估27-29
- 3.4 类目的筛选与融合29-31
- 3.5 本章小结31-33
- 第4章 分类体系的下层构建33-49
- 4.1 Instance-of关系备选集生成33-34
- 4.2 支持向量机分类器34-36
- 4.3 混合整数规划方法36-39
- 4.4 非线性整数规划方法39-41
- 4.5 实验评估41-45
- 4.5.1 数据集41-42
- 4.5.2 评估方法42-43
- 4.5.3 结果分析43-45
- 4.6 参数优化45-48
- 4.7 本章小结48-49
- 第5章 基于迭代模型的一体算法49-58
- 5.1 迭代模型50-51
- 5.2 Subclass-of关系判断51
- 5.3 类目特征更新51-52
- 5.4 实验评估52-57
- 5.4.1 数据集52-53
- 5.4.2 结果分析53-57
- 5.5 本章小结57-58
- 第6章 系统展示与总结展望58-68
- 6.1 CKB系统展示58-65
- 6.2 工作总结65-66
- 6.3 未来展望66-68
- 参考文献68-71
- 攻读硕士学位期间主要的研究成果71-72
- 致谢72
【相似文献】
中国期刊全文数据库 前10条
1 宋蓓玲;浅析构建网络信息分类体系[J];情报杂志;2004年08期
2 罗德一;;农业网络信息分类体系初探[J];农业图书情报学刊;2010年08期
3 华勋基;;十九世纪以来科学分类体系的演变及其趋势[J];图书馆学研究;1983年05期
4 夏南强;类书分类体系的发展演变[J];华中师范大学学报(人文社会科学版);2001年02期
5 刘延章;差异与改进:两种分类体系[J];图书馆论坛;2002年05期
6 史学斌;网络信息分类体系[J];图书馆;2002年02期
7 刘延章,谢琳惠;中文搜索引擎分类体系的特点、问题及其改进[J];郑州大学学报(哲学社会科学版);2002年06期
8 史学斌;网络信息分类体系[J];山东图书馆季刊;2002年01期
9 杨健,吴英梅;四库分类体系中的小说归属刍议——从二十世纪编纂的几种古籍书目谈起[J];图书馆工作与研究;2003年04期
10 郑庆胜,易晓阳;从新浪等网站看网络信息分类体系的建立——兼论综合性中文网站分类体系之建立[J];图书馆建设;2003年01期
中国重要会议论文全文数据库 前10条
1 李琳;华薇娜;;美国工程信息村中的工程分类体系探析[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年
2 房艳红;;从“15+2”模式到课程应用性分类体系基础上的多模式实践教学[A];北京高教学会实验室工作研究会2010年学术研讨会论文集(上册)[C];2010年
3 吕品;张萍;林森;顾乡;;关于改革我国排球教材技战术分类体系的研究[A];第七届全国体育科学大会论文摘要汇编(一)[C];2004年
4 王余沛;刘梅姜;;新一轮土地利用总体规划修编土地分类体系的衔接[A];2008年中国土地学会学术年会论文集[C];2008年
5 王余沛;刘梅姜;;新一轮土地利用总体规划修编土地分类体系的衔接[A];科学合理用地 人地和谐相处2008年学术年会论文集[C];2008年
6 孙剑飞;;国际洛迦诺分类体系在我国的研究与实践[A];发展知识产权服务业,支撑创新型国家建设-2012年中华全国专利代理人协会年会第三届知识产权论坛论文选编(第二部分)[C];2011年
7 姜永志;;西方心理学理论分类体系的反思与建构[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
8 廖远涛;肖荣波;艾勇军;;城乡一体的绿地分类体系研究[A];城市规划和科学发展——2009中国城市规划年会论文集[C];2009年
9 范敏;许志庆;朱宁;;CPC分类体系的特点和检索字段分析[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第二部分)[C];2014年
10 王善平;;建设科学的科技期刊论文主题-分类体系[A];学报编辑论丛(第十三集)[C];2005年
中国重要报纸全文数据库 前7条
1 本报记者 彭嘉陵;北美行业分类体系[N];中国信息报;2013年
2 忠民;透视新土地分类体系[N];中国国土资源报;2001年
3 国家知识产权局专利局机械发明审查部 刘建;美国为何选用专利分类新体系?[N];中国知识产权报;2013年
4 任晓玲;欧洲专利局即将推出清洁能源专利新分类体系[N];中国高新技术产业导报;2010年
5 本报记者 魏玮;顺应行业发展 细化基金分类体系[N];中国证券报;2009年
6 中国建筑标准设计研究院 李昭君;中国国家BIM标准探究——分类与编码势在必行[N];中国建设报;2013年
7 陈连喜;“六大管理体系”激活用人机制[N];中国人口报;2006年
中国硕士学位论文全文数据库 前9条
1 楼仁杰;基于中文百科的知识图谱分类体系构建研究[D];浙江大学;2016年
2 罗德一;农业分类搜索引擎分类体系研究[D];南京农业大学;2007年
3 刘梅;村镇教育资源分类体系的研究与应用[D];华中师范大学;2011年
4 侯永春;建设项目集成化信息分类体系研究[D];东南大学;2003年
5 黄弋芸;灾害应急管理信息资源分类体系研究[D];南昌大学;2013年
6 吴礼志;《中国网络信息分类法》编制研究[D];武汉大学;2004年
7 吕峰;《城乡规划法》背景下的城乡用地分类研究[D];华中科技大学;2011年
8 陈瑞;基于多源POI数据的匹配融合方法研究[D];兰州交通大学;2014年
9 董桂平;现代汉语义类词典分类体系考察与研究[D];鲁东大学;2012年
,本文编号:1124732
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1124732.html