当前位置:主页 > 科技论文 > 软件论文 >

基于深度学习的植物知识图谱的构建

发布时间:2021-01-18 00:09
  随着信息技术的快速发展,特别是人工智能技术的广泛应用,如何处理网络中海量的数据,向用户提供易理解的知识成为研究的热点。知识图谱对实现数据到知识的转化有重要作用,其目的是对真实世界中存在的实体、概念及其关联关系进行描述。在林业领域,知识图谱可在语义检索、数据挖掘、预测分析、智能问答和决策支持等应用场景下发挥重要作用。本文在植物信息领域,研究基于多种数据源构建植物知识图谱的方法,在知识图谱的构建、命名实体识别和基于知识图谱的语义检索等方面展开工作。分析了领域知识图谱的构建过程,并阐述了涉及的关键技术。总结了中国植物志文本的特点,研究如何在其上进行属性命名实体的识别,提出了基于深度神经网络的命名实体识别方法。研究了植物信息相关的数据源,充分利用行业网站和百科网站的信息。利用不同数据源的信息构建植物知识图谱,将其应用于语义检索问题,结合可视化技术构建了基于植物知识图谱的语义检索系统。植物知识图谱作为林业领域知识图谱构建的尝试,可为用户提供智能、直观的语义检索。未来可在此基础上进一步融合其他林业知识,作为智慧林业发展的知识支撑,服务于林业领域的语义检索、知识推理和决策支持等应用。 

【文章来源】:北京林业大学北京市 211工程院校 教育部直属院校

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
1 引言
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 通用知识图谱的构建
        1.2.2 领域知识图谱的构建
        1.2.3 开放知识图谱项目
    1.3 研究内容和创新点
        1.3.1 研究内容
        1.3.2 创新点
    1.4 论文的组织结构
2 知识图谱相关理论和技术
    2.1 知识图谱的定义
    2.2 通用知识图谱和领域知识图谱
    2.3 领域知识图谱的构建过程和难点
        2.3.1 领域知识图谱的构建过程
        2.3.2 中文知识图谱构建的难点
    2.4 知识图谱构建的关键技术
        2.4.1 实体识别
        2.4.2 实体消歧
        2.4.3 关系抽取
        2.4.4 知识推理
        2.4.5 知识存储
        2.4.6 知识表示
    2.5 本章小结
3 植物属性文本的命名实体识别算法
    3.1 命名实体任务概述
        3.1.1 背景
        3.1.2 基于规则的方法
        3.1.3 基于统计机器学习的方法
        3.1.4 基于深度学习的方法
    3.2 植物属性文本数据集的构建
        3.2.1 植物属性文本分析
        3.2.2 数据集构建
    3.3 算法整体框架
        3.3.1 基于BiLSTM的特征提取模块
        3.3.2 基于CNN的特征提取模块
        3.3.3 基于CRF的标注模块
    3.4 实验结果与分析
        3.4.1 评价指标
        3.4.2 基于句子特征表示的结果分析
        3.4.3 基于训练参数的结果分析
        3.4.4 基于多种模型的结果分析
    3.5 本章小结
4 植物知识图谱的构建
    4.1 数据源的选择
        4.1.1 中国植物志
        4.1.2 中国林业信息网
        4.1.3 百度百科
    4.2 概念体系结构定义
    4.3 实体信息获取
        4.3.1 结构化数据
        4.3.2 半结构化数据
        4.3.3 非结构化数据
    4.4 实体关系获取
    4.5 多数据源的知识融合
        4.5.1 知识融合
        4.5.2 植物知识图谱的存储
    4.6 本章小结
5 基于植物知识图谱的语义检索系统
    5.1 语义检索概述
    5.2 基于植物知识图谱的语义检索
        5.2.1 基于植物知识图谱的语义检索过程
        5.2.2 实体匹配过程
        5.2.3 问句理解过程
        5.2.4 基于植物知识图谱的语义检索示例
    5.3 知识图谱的可视化
    5.4 本章小结
6 研究总结和展望
    6.1 研究工作总结
    6.2 展望
参考文献
个人简介
导师简介
获得成果目录
致谢


【参考文献】:
期刊论文
[1]知识图谱数据管理研究综述[J]. 王鑫,邹磊,王朝坤,彭鹏,冯志勇.  软件学报. 2019(07)
[2]基于Neo4j对涉藏领域本体的存储方法研究[J]. 王飞,易绵竹,谭新,陈永升,向一帆.  郑州大学学报(理学版). 2019(02)
[3]命名实体识别研究综述[J]. 刘浏,王东波.  情报学报. 2018(03)
[4]面向知识图谱的知识推理研究进展[J]. 官赛萍,靳小龙,贾岩涛,王元卓,程学旗.  软件学报. 2018(10)
[5]面向误诊提示的疾病-症状语义网构建[J]. 黄岚,纪林影,姚刚,翟睿峰,白天.  吉林大学学报(工学版). 2018(03)
[6]基于条件随机场的农作物病虫害及农药命名实体识别[J]. 李想,魏小红,贾璐,陈昕,刘磊,张彦娥.  农业机械学报. 2017(S1)
[7]面向互联网资源的医学命名实体识别研究[J]. 田家源,杨东华,王宏志.  计算机科学与探索. 2018(06)
[8]基于BLSTM的命名实体识别方法[J]. 冯艳红,于红,孙庚,孙娟娟.  计算机科学. 2018(02)
[9]从文本中构建领域本体技术综述[J]. 任飞亮,沈继坤,孙宾宾,朱靖波.  计算机学报. 2019(03)
[10]基于词汇语义信息的文本相似度计算[J]. 谷重阳,徐浩煜,周晗,张俊杰.  计算机应用研究. 2018(02)

博士论文
[1]面向大规模知识图谱的弹性语义推理方法研究及应用[D]. 陈曦.浙江大学 2017
[2]基于多种数据源的中文知识图谱构建方法研究[D]. 胡芳槐.华东理工大学 2015

硕士论文
[1]基于Neo4j图数据库的社交网络数据的研究与应用[D]. 张凤军.湖南大学 2016



本文编号:2983866

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2983866.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24386***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com