基于图书的概念—描述词知识网络的构建及应用
本文关键词:基于图书的概念—描述词知识网络的构建及应用
【摘要】:随着信息技术的普及和互联网技术的飞速发展,人类积累的数据量正在以指数的速度迅速增长。在数字图书馆领域,CADAL已经积累大量的数字图书,并提供了相应的图书阅读服务。显然,每一本图书都包含有大量的知识片段,如果能将这些资源进行分解、关联和再组织,形成按照一定目标、主题组织的内容,将会产生更大的价值。鉴于此,本论文在基于CADAL数字图书馆中的海量图书资源的基础上,从图书中构建概念-描述词知识网络,完成对图书知识的抽取和分解;然后在知识网络的基础上生成概念百科,完成对知识的关联和组织。论文的主要工作如下:(1)基于数字图书构建了概念-描述词知识网络。首先,本文给出了知识网络的原型。随后,提出了一种基于词嵌入(word embedding)匹配的算法用来解决目录的短语抽取问题,并训练分类器将目录短语分类成概念和描述词,从而构建得到概念-描述词知识网络。(2)本文提出基于Learning to Rank算法的百科词条目录生成算法,对从概念-描述词知识网络得到的候选描述词进行排序,使得词条目录反映知识阐述的前后顺序。(3)基于短语抽取、短语分类、描述词排序等算法实现了基于概念-描述词知识网络的概念百科生成系统。
【关键词】:知识服务 知识图谱 组块标注 词嵌入
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
- 摘要4-5
- Abstract5-11
- 第1章 绪论11-15
- 1.1 课题背景11
- 1.2 课题意义11-13
- 1.3 本文的主要工作13
- 1.4 本文的组织结构13-14
- 1.5 本章小结14-15
- 第2章 相关研究综述15-27
- 2.1 知识图谱15-17
- 2.1.1 谷歌知识图谱16
- 2.1.2 搜狗知立方16-17
- 2.1.3 百度知心17
- 2.2 组块标注17-21
- 2.2.1 基于支持向量机的组块标注18
- 2.2.2 基于隐马尔科夫模型的组块标注18-19
- 2.2.3 基于条件随机场的组块标注19-21
- 2.3 词嵌入21-25
- 2.3.1 词嵌入的训练22-24
- 2.3.2 词嵌入训练工具24-25
- 2.4 排序学习算法25-26
- 2.5 本章小结26-27
- 第3章 概念-描述词知识网络构建关键技术27-42
- 3.1 概念-描述词知识网络概述27-28
- 3.2 基于词嵌入匹配的短语抽取算法28-35
- 3.2.1 算法总体设计29-31
- 3.2.2 特征设计31-32
- 3.2.3 模型求解32-35
- 3.3 目录短语分类35-38
- 3.3.1 分类算法选择36
- 3.3.2 特征设计36-38
- 3.4 基于排序学习的描述词排序38-41
- 3.4.1 模型选择38-39
- 3.4.2 特征设计39-41
- 3.5 本章小结41-42
- 第4章 概念百科生成系统的设计与实现42-55
- 4.1 概念百科生成系统的需求分析42-43
- 4.2 概念百科生成系统的架构设计43-44
- 4.3 概念百科生成系统的模块设计与实现44-51
- 4.3.1 目录预处理模块44-46
- 4.3.2 概念-描述词知识网络的构建模块46-47
- 4.3.3 知识网络存储模块47-48
- 4.3.4 概念词条目录生成模块48-50
- 4.3.5 概念词条章节内容生成模块50-51
- 4.4 系统展示51-54
- 4.5 本章小结54-55
- 第5章 实验及结果分析55-68
- 5.1 实验数据集55
- 5.2 词嵌入匹配算法相关实验55-64
- 5.2.1 评测标准55-56
- 5.2.2 组块标注实验56-58
- 5.2.3 目录短语抽取实验58-64
- 5.3 短语分类实验64-65
- 5.4 描述词排序实验65-67
- 5.4.1 评测标准65-66
- 5.4.2 实验过程及分析66-67
- 5.5 本章小结67-68
- 第6章 总结与展望68-70
- 6.1 总结68
- 6.2 展望68-70
- 参考文献70-74
- 致谢74
【相似文献】
中国期刊全文数据库 前10条
1 肖冬平;刘淑银;;知识网络中节点的结构位置及其测度——基于社会网络的分析[J];图书情报工作;2010年10期
2 王涛;顾新;;知识网络组织之间相互信任的建立过程分析[J];情报杂志;2011年04期
3 程慧平;孙建军;;社会网络与知识网络之比较[J];情报资料工作;2011年01期
4 任慧;;企业知识网络内涵述评[J];情报理论与实践;2013年10期
5 顾龙翔;;国外卫星电视知识网络[J];电子技术;1985年10期
6 郑士贵;知识网络[J];管理科学文摘;1997年01期
7 袁剑;;文化遭遇与知识网络[J];读书;2011年11期
8 李丹,俞竹超,樊治平;知识网络的构建过程分析[J];科学学研究;2002年06期
9 马德辉;包昌火;;企业知识网络探析[J];情报理论与实践;2007年06期
10 王众托;;无处不在的网络社会中的知识网络[J];信息系统学报;2007年01期
中国重要会议论文全文数据库 前5条
1 陈晓宇;王国红;;基于知识网络的企业技术学习模式研究[A];中国企业运筹学[C];2006年
2 陈晓荣;丁th;韩丽川;;知识网络连接机制对知识扩散的影响[A];第九届中国管理科学学术年会论文集[C];2007年
3 王海龙;肖剑杰;;半导体产业模块化知识网络对发明效用的影响研究[A];第九届中国科技政策与管理学术年会论文集[C];2013年
4 Noshir S.Contractor;;知识网络的共同发展与21世纪的组织形式(英文)[A];北京论坛(2004)文明的和谐与共同繁荣:“IT产业与现代文明传播”信息传播分论坛论文或摘要集[C];2004年
5 方德英;陈建斌;徐凯波;;IT服务外包中复杂知识网络协同演化概念模型研究[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
中国重要报纸全文数据库 前6条
1 商报记者 钱秀中;浙古社举办国学知识网络大赛[N];中国图书商报;2011年
2 于冬雪;ETS托福知识网络竞赛启动[N];南方日报;2008年
3 刘寿坤;闽西开通首家CNKI知识网络服务站[N];福建邮电报;2000年
4 余江 缪双妍;从“嵌入全球制造网络”到“撬动国际知识网络”[N];科技日报;2013年
5 本报记者 苗野;网络游戏成税法宣传新形式[N];财会信报;2008年
6 黄委黄河水利科学研究院院长 时明立;全面强化责任 夯实洽黄科研安全防线[N];黄河报;2014年
中国博士学位论文全文数据库 前7条
1 李江;基于知识网络的企业网络化创新能力研究[D];天津大学;2008年
2 李文博;企业知识网络复杂系统的结构与演化:产业集群情境下的实证研究[D];浙江工商大学;2009年
3 阳志梅;基于知识网络与企业知识能力的高技术集群企业成长研究[D];中南大学;2010年
4 代风;面向复杂产品研发过程的知识网络理论及集成应用研究[D];浙江大学;2015年
5 徐蕾;知识网络双重嵌入对集群企业创新能力提升的机理研究[D];浙江大学;2012年
6 辛晴;知识网络对企业创新的影响[D];山东大学;2011年
7 全利平;基于知识网络的科研团队知识及任务管理研究[D];复旦大学;2012年
中国硕士学位论文全文数据库 前10条
1 江丁丁;开放式协同创新知识网络的若干关键技术研究[D];浙江大学;2015年
2 白亭亭;我国区域知识网络结构演化的多尺度比较研究[D];南京师范大学;2015年
3 王友文;基于知识网络嵌入的集群企业核心能力成长机理研究[D];南京财经大学;2014年
4 林智同;知识网络嵌入性影响研发团队创造力的作用机制[D];中国计量学院;2015年
5 王艳刚;超地方知识网络与企业外部知识集成关系研究[D];河北科技大学;2015年
6 龚军;基于图书的概念—描述词知识网络的构建及应用[D];浙江大学;2016年
7 丁th;复杂知识网络的结构特征对知识流动的影响[D];上海交通大学;2009年
8 肖剑杰;半导体产业知识网络模块化测度及其影响研究[D];大连理工大学;2013年
9 舒刚;基于知识网络的企业知识管理研究[D];武汉理工大学;2008年
10 吴莎;互联网大规模协作知识网络演化机理与仿真[D];湖南大学;2010年
,本文编号:619257
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/619257.html