基于深度学习的商业领域知识图谱构建
本文关键词:基于深度学习的商业领域知识图谱构建,,由笔耕文化传播整理发布。
【摘要】:知识图谱是一种以可视化的方式展示信息中包含的知识要点、核心结构、整体知识架构的技术。近年来随着科技创新,商业领域开始青睐知识图谱这一图形化展示方法。然而目前知识图谱在商业领域的应用主要局限于搜索引擎和问答系统等方面,通过分析百科知识或知识库中包含的知识实体来为使用者提供知识服务。其他方面并没有得到广泛应用。究其原因,主要在于非结构化文本的知识抽取和知识图谱绘制这两方面的技术难点。其中,尤以非结构化文化的知识抽取最为关键,本文将着眼于知识图谱的知识抽取这一关键环节,拟采用深度学习算法解决知识图谱中的知识抽取这一关键问题,并引入图形数据库,为知识图谱的绘制提供一种新的思路。深度学习是近年来机器学习领域中的一个热点,相对于以往的浅层学习模型,它能够更好地模拟人脑的学习方式,以达到更好的学习效果。深度学习算法一般具有较多的层次结构,利用深层且非线性的学习结构,它可以实现对复杂函数的逼近。本论文将广泛应用于学科领域的知识图谱概念延伸到商业领域中,通过引入机器学习中的深度学习算法,搭建基于深度学习的商业领域知识图谱构建框架,采用深度置信网络算法自动提取非结构化商业文本中蕴含的知识单元及单元之间的关系,以此解决商业领域知识单元提取这一难点,提高知识单元提取的准确率。此外,本论文还将引入图形数据库,实现知识单元的存储和知识图谱的绘制,为商业知识图谱的绘制提供一种新的思路。
【关键词】:知识图谱 深度学习 深度置信网络 图形数据库
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:G350
【目录】:
- 摘要6-7
- ABSTRACT7-10
- 1 绪论10-22
- 1.1 选题背景及现实意义10-11
- 1.2 知识图谱相关研究综述11-18
- 1.2.1 知识图谱类型11-12
- 1.2.2 知识图谱构建方法12-14
- 1.2.3 知识图谱构建流程14-17
- 1.2.4 知识图谱在商业领域的应用17-18
- 1.3 论文的基本内容18-19
- 1.4 论文的创新点19-20
- 1.5 论文的基本框架20-22
- 2 相关理论介绍22-33
- 2.1 深度学习理论22-29
- 2.1.1 浅层学习与深度学习22-23
- 2.1.2 受限玻尔兹曼机23-26
- 2.1.3 反向传播网络26-28
- 2.1.4 深度置信网络28-29
- 2.2 图形数据库理论与方法29-32
- 2.2.1 图形数据库概念29-30
- 2.2.2 Neo4j图形数据库30-32
- 2.3 本章小结32-33
- 3 基于深度学习算法的商业领域知识图谱构建(BKG-DL)框架33-44
- 3.1 BKG-DL框架的流程33-35
- 3.2 基于深度置信网络的中文知识实体识别35-38
- 3.2.1 知识实体识别35-36
- 3.2.2 特征选择36-38
- 3.3 基于深度置信网络的中文实体关系识别38-42
- 3.3.1 实体关系识别38-40
- 3.3.2 特征选择40-42
- 3.4 知识图谱的绘制42-43
- 3.4.1 知识图谱绘制流程42-43
- 3.4.2 知识图谱绘制方法43
- 3.5 本章小结43-44
- 4 移动互联网领域在线新闻的知识图谱构建实证44-58
- 4.1 数据来源45
- 4.2 分词45-47
- 4.2.1 构造分词词典46-47
- 4.2.2 基于词典进行分词47
- 4.3 知识实体识别47-51
- 4.3.1 数据预处理48-49
- 4.3.2 特征选择49-50
- 4.3.3 实验与分析50-51
- 4.4 实体关系识别51-54
- 4.4.1 数据预处理51-52
- 4.4.2 特征选择52-53
- 4.4.3 实验与分析53-54
- 4.5 知识图谱的绘制54-55
- 4.5.1 数据入库54
- 4.5.2 图形绘制54-55
- 4.6 知识图谱的应用55-57
- 4.6.1 领域发展现状分析56-57
- 4.6.2 领域高层流动分析57
- 4.7 本章小结57-58
- 5 基于深度学习的商业领域知识图谱应用实例58-63
- 5.1 医疗知识图谱58-60
- 5.1.1 背景介绍58
- 5.1.2 数据来源58
- 5.1.3 构建知识图谱58-59
- 5.1.4 知识图谱分析59-60
- 5.2 人才发现与人才培养60-62
- 5.2.1 背景介绍60
- 5.2.2 数据来源60
- 5.2.3 构建知识图谱60-61
- 5.2.4 知识图谱分析61-62
- 5.3 本章小结62-63
- 6 结论63-65
- 6.1 总结63
- 6.2 展望63-65
- 参考文献65-69
- 后记69
【相似文献】
中国期刊全文数据库 前10条
1 邓擘;郑彦宁;傅继彬;;汉语实体关系模式的自动获取研究[J];计算机科学;2010年02期
2 车万翔,刘挺,李生;实体关系自动抽取[J];中文信息学报;2005年02期
3 朱鸿宇;刘瑰;陈左宁;唐福华;;实体关系识别中长距离依赖问题的研究[J];小型微型计算机系统;2008年02期
4 牟晋娟;包宏;;中文实体关系抽取研究[J];计算机工程与设计;2009年15期
5 朱姗;;基于规则和本体的实体关系抽取系统研究[J];情报杂志;2010年S2期
6 周利娟;林鸿飞;罗文华;;基于实体关系的犯罪网络识别机制[J];计算机应用研究;2011年03期
7 董静;孙乐;冯元勇;黄瑞红;;中文实体关系抽取中的特征选择研究[J];中文信息学报;2007年04期
8 徐健;张智雄;吴振新;;实体关系抽取的技术方法综述[J];现代图书情报技术;2008年08期
9 黄晨;钱龙华;周国栋;朱巧明;;基于卷积树核的无指导中文实体关系抽取研究[J];中文信息学报;2010年04期
10 李小红;钱龙华;;基于自举的弱指导中文实体关系抽取研究[J];高科技与产业化;2010年09期
中国重要会议论文全文数据库 前3条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
2 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
3 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘龙;音乐领域全局实体关系抽取研究[D];哈尔滨工业大学;2010年
2 雷春雅;领域实体关系自动抽取研究[D];昆明理工大学;2011年
3 刘安安;开放式中文实体关系抽取研究[D];哈尔滨工业大学;2013年
4 陈超;基于互联网的二元实体关系抽取研究[D];华东师范大学;2013年
5 周蓝s
本文编号:265439
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/265439.html