大数据环境下高血压知识库构建与系统集成方法研究
发布时间:2021-06-17 17:42
针对多源异构数据提出一种数据驱动、自底向上、启发式的知识库构建方法。阐述其数据采集、本体库构建、知识抽取、知识融合、知识存储以及知识更新等方面,为知识图谱相关研究提供有益参考。
【文章来源】:医学信息学杂志. 2020,41(10)
【文章页数】:6 页
【部分图文】:
图1高血压知识库构建流程??属件抽取??知识抽取??知识繳合????38????
关系及属性,其分类效果直接影响上层??应用准确性。属性可视为实体与属性值之间一种名??词性关系,因此可将属性抽取任务转化为关系抽取??任务。利用引入注意力机制的Bi?-LSTM?(Att?-??BiLSTM)模型进行关系分类及属性抽龋基本流程??是:将预训练的词向量作为输入,利用Bi-LSTM??抽取文本中的高层语义特征,注意力层通过引人权??重向量将词级特征合并为句级特征,以此捕捉句子??的深层语义特征,利用特征分类器得到两个实体之??间的关系。关系分类及属性抽取基本流程,见图3。??5.3半结构化数据??面向半结构化数据的知识抽取利用包装器。包??装器是一种基于规则的文本信息抽取模型,其规则??集合易于建立且抽取精度高,适用于半结构化数据??的知识抽龋包装器基本工作流程是:首先根据输??图3关系分类及属性抽取基本流程??人数据从规则库中选择对应的规则,将规则传入规??则执行模块;然后将规则执行模块中的规则应用于??输入数据,抽取出有用信息;最后将上述信息传人??信息转换模块中,将传人的信息转换为特定格式的??知识。包装器工作流程,见图4。??:?包装器??!??厂??规则执行模块??规则库??〕??)??信息转换模块??〇〇??—??半结构化数据?知识??图4包装器工作流程??6知识融合与知识存储??6.?1?知识融合??6.1.1概述知识融合是知识图谱构建过程中重??要步骤。通过知识融合可将知识图谱内部实体进行??精简,使知识图谱运转更加有效。知识融合包括实??体对齐、实体消歧和重复知识合并3方面内容。??6.1.2实体对齐也称为共指消解、实体匹配、??实体同义,用于解决多个指称对应
本流程,见图3。??5.3半结构化数据??面向半结构化数据的知识抽取利用包装器。包??装器是一种基于规则的文本信息抽取模型,其规则??集合易于建立且抽取精度高,适用于半结构化数据??的知识抽龋包装器基本工作流程是:首先根据输??图3关系分类及属性抽取基本流程??人数据从规则库中选择对应的规则,将规则传入规??则执行模块;然后将规则执行模块中的规则应用于??输入数据,抽取出有用信息;最后将上述信息传人??信息转换模块中,将传人的信息转换为特定格式的??知识。包装器工作流程,见图4。??:?包装器??!??厂??规则执行模块??规则库??〕??)??信息转换模块??〇〇??—??半结构化数据?知识??图4包装器工作流程??6知识融合与知识存储??6.?1?知识融合??6.1.1概述知识融合是知识图谱构建过程中重??要步骤。通过知识融合可将知识图谱内部实体进行??精简,使知识图谱运转更加有效。知识融合包括实??体对齐、实体消歧和重复知识合并3方面内容。??6.1.2实体对齐也称为共指消解、实体匹配、??实体同义,用于解决多个指称对应同一实体对象问??题。利用实体对齐可将多个指称项关联到统一实体??对象,以便将语义网络中的分散实体互联起来。本??文通过计算Word2vec模型的词间空间距离,以此??代表词间语义相似度,设定相似度阈值来划分本体??间的关系,以此得到待对齐实体。??6.1.3实体消歧可以消除同名实体产生的歧??义。由于目标实体概念集合不确定,采用基于聚类??的命名实体消歧。将指向目标实体的指称项取出并??聚在同一个类别下。每个类别包含某一个命名实体??的所有可能指向的指称项。根据命
【参考文献】:
期刊论文
[1]词向量语义表示研究进展[J]. 李枫林,柯佳. 情报科学. 2019(05)
[2]中国高血压防治指南(2018年修订版)[J]. Writing Group of 2018 Chinese Guidelines for the Management of Hypertension, Chinese Hypertension League, Chinese Society of Cardiology, Chinese Medical Doctor Association Hypertension Committee, Hypertension Branch of China International Exchange and Promotive Association for Medical and Health Care, Hypertension Branch of Chinese Geriatric Medical Association;. 中国心血管杂志. 2019(01)
[3]慢性病的治与防[J]. 本刊编辑部. 国际医药卫生导报. 2018 (15)
[4]专利文本主题建模中领域停用词自动选取研究[J]. 俞琰,赵乃瑄. 图书情报工作. 2018(11)
[5]基于多数据源的知识图谱构建方法研究[J]. 吴运兵,阴爱英,林开标,余小燕,赖国华. 福州大学学报(自然科学版). 2017(03)
[6]词形还原方法及实现工具比较分析[J]. 吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜. 现代图书情报技术. 2012(03)
[7]中国高血压防治指南2010[J]. 刘力生. 中国医学前沿杂志(电子版). 2011(05)
[8]领域本体的构建方法研究[J]. 张文秀,朱庆华. 图书与情报. 2011(01)
本文编号:3235634
【文章来源】:医学信息学杂志. 2020,41(10)
【文章页数】:6 页
【部分图文】:
图1高血压知识库构建流程??属件抽取??知识抽取??知识繳合????38????
关系及属性,其分类效果直接影响上层??应用准确性。属性可视为实体与属性值之间一种名??词性关系,因此可将属性抽取任务转化为关系抽取??任务。利用引入注意力机制的Bi?-LSTM?(Att?-??BiLSTM)模型进行关系分类及属性抽龋基本流程??是:将预训练的词向量作为输入,利用Bi-LSTM??抽取文本中的高层语义特征,注意力层通过引人权??重向量将词级特征合并为句级特征,以此捕捉句子??的深层语义特征,利用特征分类器得到两个实体之??间的关系。关系分类及属性抽取基本流程,见图3。??5.3半结构化数据??面向半结构化数据的知识抽取利用包装器。包??装器是一种基于规则的文本信息抽取模型,其规则??集合易于建立且抽取精度高,适用于半结构化数据??的知识抽龋包装器基本工作流程是:首先根据输??图3关系分类及属性抽取基本流程??人数据从规则库中选择对应的规则,将规则传入规??则执行模块;然后将规则执行模块中的规则应用于??输入数据,抽取出有用信息;最后将上述信息传人??信息转换模块中,将传人的信息转换为特定格式的??知识。包装器工作流程,见图4。??:?包装器??!??厂??规则执行模块??规则库??〕??)??信息转换模块??〇〇??—??半结构化数据?知识??图4包装器工作流程??6知识融合与知识存储??6.?1?知识融合??6.1.1概述知识融合是知识图谱构建过程中重??要步骤。通过知识融合可将知识图谱内部实体进行??精简,使知识图谱运转更加有效。知识融合包括实??体对齐、实体消歧和重复知识合并3方面内容。??6.1.2实体对齐也称为共指消解、实体匹配、??实体同义,用于解决多个指称对应
本流程,见图3。??5.3半结构化数据??面向半结构化数据的知识抽取利用包装器。包??装器是一种基于规则的文本信息抽取模型,其规则??集合易于建立且抽取精度高,适用于半结构化数据??的知识抽龋包装器基本工作流程是:首先根据输??图3关系分类及属性抽取基本流程??人数据从规则库中选择对应的规则,将规则传入规??则执行模块;然后将规则执行模块中的规则应用于??输入数据,抽取出有用信息;最后将上述信息传人??信息转换模块中,将传人的信息转换为特定格式的??知识。包装器工作流程,见图4。??:?包装器??!??厂??规则执行模块??规则库??〕??)??信息转换模块??〇〇??—??半结构化数据?知识??图4包装器工作流程??6知识融合与知识存储??6.?1?知识融合??6.1.1概述知识融合是知识图谱构建过程中重??要步骤。通过知识融合可将知识图谱内部实体进行??精简,使知识图谱运转更加有效。知识融合包括实??体对齐、实体消歧和重复知识合并3方面内容。??6.1.2实体对齐也称为共指消解、实体匹配、??实体同义,用于解决多个指称对应同一实体对象问??题。利用实体对齐可将多个指称项关联到统一实体??对象,以便将语义网络中的分散实体互联起来。本??文通过计算Word2vec模型的词间空间距离,以此??代表词间语义相似度,设定相似度阈值来划分本体??间的关系,以此得到待对齐实体。??6.1.3实体消歧可以消除同名实体产生的歧??义。由于目标实体概念集合不确定,采用基于聚类??的命名实体消歧。将指向目标实体的指称项取出并??聚在同一个类别下。每个类别包含某一个命名实体??的所有可能指向的指称项。根据命
【参考文献】:
期刊论文
[1]词向量语义表示研究进展[J]. 李枫林,柯佳. 情报科学. 2019(05)
[2]中国高血压防治指南(2018年修订版)[J]. Writing Group of 2018 Chinese Guidelines for the Management of Hypertension, Chinese Hypertension League, Chinese Society of Cardiology, Chinese Medical Doctor Association Hypertension Committee, Hypertension Branch of China International Exchange and Promotive Association for Medical and Health Care, Hypertension Branch of Chinese Geriatric Medical Association;. 中国心血管杂志. 2019(01)
[3]慢性病的治与防[J]. 本刊编辑部. 国际医药卫生导报. 2018 (15)
[4]专利文本主题建模中领域停用词自动选取研究[J]. 俞琰,赵乃瑄. 图书情报工作. 2018(11)
[5]基于多数据源的知识图谱构建方法研究[J]. 吴运兵,阴爱英,林开标,余小燕,赖国华. 福州大学学报(自然科学版). 2017(03)
[6]词形还原方法及实现工具比较分析[J]. 吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜. 现代图书情报技术. 2012(03)
[7]中国高血压防治指南2010[J]. 刘力生. 中国医学前沿杂志(电子版). 2011(05)
[8]领域本体的构建方法研究[J]. 张文秀,朱庆华. 图书与情报. 2011(01)
本文编号:3235634
本文链接:https://www.wllwen.com/yixuelunwen/xxg/3235634.html
最近更新
教材专著