营养学知识图谱构建及补全技术研究
发布时间:2023-02-18 14:04
近年来,随着国民健康意识的提高,人们越来越重视饮食均衡和维护身体健康状况,饮食作为人们在日常生活中最为关注的事情之一,以科学的营养学知识为依据,为国民提供食物、营养的建议具有重要意义。大数据和人工智能技术的高速发展为营养学的研究提供了新的角度。本课题主要基于专业的营养学书籍和网站中的营养学数据,构建了营养学知识图谱并研究了知识图谱的补全方法。我们开展了以下几项工作:(1)本文首先构建了营养学知识概念及关系体系,给出了营养学知识图谱中实体类型以及实体间关系的定义并给出了相关的样例说明。营养学知识图谱中主要包含八种类型的实体和十二种类型的实体间关系。本文获取了《临床营养学》、《中国居民膳食指南》、《中国食物成分表》和39健康网、美食杰网站中的营养学数据。通过对其进行命名实体识别、实体对齐、知识表示等工作,基于词数据构建了营养学知识图谱。(2)接着,本文对营养学知识图谱的关系构建进行了研究。由于知识图谱的数据总是不完备的,为了解决实体间关系缺失的问题,本文提出了营养学实体关系分类模型。使用R-GCN模型和多头注意力机制提取知识图谱中营养学实体的特征,进行分类预测实体间潜在关系。实验对比了基于...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景及研究的目的和意义
1.1.1 课题背景
1.1.2 研究的目的及意义
1.2 国内外研究现状
1.2.1 知识图谱研究现状
1.2.2 关系分类方法研究现状
1.2.3 链路预测方法研究现状
1.3 主要研究内容
1.4 结构安排
第2章 营养学知识图谱的构建
2.1 引言
2.2 营养学数据获取及分析
2.2.1 营养学书籍数据预处理
2.2.2 网站数据获取及处理
2.2.3 数据统计
2.3 知识图谱模式层定义
2.3.1 实体定义
2.3.2 关系定义
2.4 营养学知识图谱构建
2.4.1 命名实体识别
2.4.2 实体对齐
2.4.3 知识表示与统计
2.5 本章小结
第3章 营养学实体关系分类模型研究
3.1 引言
3.2 训练数据构建方法
3.3 基于R-GCN的营养学实体关系分类模型
3.3.1 GCN
3.3.2 R-GCN
3.4 基于传统机器学习方法的营养学实体关系分类模型
3.4.1 K近邻
3.4.2 逻辑回归算法
3.4.3 支持向量机算法
3.5 基于多头注意力机制的营养学实体关系分类模型
3.6 实验设计及评价
3.6.1 数据预处理
3.6.2 实验设置
3.6.3 评价方法
3.7 实验结果与分析
3.7.1 系统性能
3.7.2 关系小类性能对比
3.8 本章小结
第4章 基于营养学知识表示的链路预测方法研究
4.1 引言
4.2 知识表示
4.3 语义匹配模型
4.3.1 RESCAL
4.3.2 DistMult
4.3.3 ComplEx
4.4 平移距离模型
4.4.1 TransE
4.4.2 RotatE
4.5 负例生成方法
4.5.1 均匀采样
4.5.2 Bern
4.5.3 自对抗负采样
4.6 数据统计分析
4.7 实验设计及评价
4.7.1 实验设计
4.7.2 评价方法
4.8 实验结果与分析
4.8.1 模型性能与分析
4.8.2 关系小类结果
4.8.3 负采样实验
4.9 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3745107
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景及研究的目的和意义
1.1.1 课题背景
1.1.2 研究的目的及意义
1.2 国内外研究现状
1.2.1 知识图谱研究现状
1.2.2 关系分类方法研究现状
1.2.3 链路预测方法研究现状
1.3 主要研究内容
1.4 结构安排
第2章 营养学知识图谱的构建
2.1 引言
2.2 营养学数据获取及分析
2.2.1 营养学书籍数据预处理
2.2.2 网站数据获取及处理
2.2.3 数据统计
2.3 知识图谱模式层定义
2.3.1 实体定义
2.3.2 关系定义
2.4 营养学知识图谱构建
2.4.1 命名实体识别
2.4.2 实体对齐
2.4.3 知识表示与统计
2.5 本章小结
第3章 营养学实体关系分类模型研究
3.1 引言
3.2 训练数据构建方法
3.3 基于R-GCN的营养学实体关系分类模型
3.3.1 GCN
3.3.2 R-GCN
3.4 基于传统机器学习方法的营养学实体关系分类模型
3.4.1 K近邻
3.4.2 逻辑回归算法
3.4.3 支持向量机算法
3.5 基于多头注意力机制的营养学实体关系分类模型
3.6 实验设计及评价
3.6.1 数据预处理
3.6.2 实验设置
3.6.3 评价方法
3.7 实验结果与分析
3.7.1 系统性能
3.7.2 关系小类性能对比
3.8 本章小结
第4章 基于营养学知识表示的链路预测方法研究
4.1 引言
4.2 知识表示
4.3 语义匹配模型
4.3.1 RESCAL
4.3.2 DistMult
4.3.3 ComplEx
4.4 平移距离模型
4.4.1 TransE
4.4.2 RotatE
4.5 负例生成方法
4.5.1 均匀采样
4.5.2 Bern
4.5.3 自对抗负采样
4.6 数据统计分析
4.7 实验设计及评价
4.7.1 实验设计
4.7.2 评价方法
4.8 实验结果与分析
4.8.1 模型性能与分析
4.8.2 关系小类结果
4.8.3 负采样实验
4.9 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3745107
本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/3745107.html