当前位置:主页 > 医学论文 > 临床医学论文 >

领域本体驱动的乳腺超声检查报告结构化研究与实现

发布时间:2020-04-23 19:22
【摘要】:乳腺超声检查因其高准确率、低检查费用、可多切面观察等特点,已经成为诊断乳腺疾病的重要方式。乳腺超声检查报告记录着患者的影像表现、医生对患者的临床诊断和诊断意见等内容,蕴含着丰富的乳腺医学知识,具有极高的研究价值。医生为了更加准确的描述患者病情,通常以自然语言的形式描述影像表现和诊断意见,但是这种非结构化文本具有叙述性、无结构、数据描述不统一的特点,不利于计算机自动分析和挖掘数据,在一定程度上阻碍了医疗大数据的发展。因此,有必要对乳腺超声检查报告进行结构化处理,使其为更大规模的医疗数据研究服务。为解决上述问题,本文在传统结构化技术基础上,结合乳腺超声检查报告的文本特点,提出了一种领域本体驱动的乳腺超声检查报告结构化方法。该方法首先构建乳腺超声领域本体,然后基于领域本体实现了乳腺超声检查报告的结构化处理。本文所做的研究如下:1)构建了乳腺超声领域本体。本文采用自动构建本体的思想,结合病理学和解剖学的先验知识,获取乳腺超声领域本体的基础框架;然后对乳腺超声文本做数据预处理,包括中文分词、同义词替换和文本切分,并以切分后的描述块为处理单位,采用命名实体识别和实体关系抽取算法,获取实体关系三元组;最后向乳腺超声领域本体的基础框架添加内容,构建完成乳腺超声领域本体。2)提出了一种领域本体驱动的乳腺超声检查报告结构化方法。该方法首先对乳腺超声文本做数据预处理,得到文本切分后的多个描述块和对应的领域本体分支子树,以领域本体的叶子节点和路径为研究出发点,根据算法扫描器中的获取分支子树路径算法和生成语义子树算法,在领域本体中进行节点信息匹配,得到与乳腺超声报告对应的乳腺超声语义子树。最后将XML表示的乳腺超声语义子树转化为以关系型表结构存储的乳腺超声结构化数据。3)实现了超声报告结构化移动端系统。用户可以以拍照或输入文字的方式,上传乳腺超声检查报告,即可得到乳腺超声报告的结构化结果,方便患者用户了解自身病情,为患者提供更高效、更便捷的医疗服务。本文采用某三甲医院的乳腺超声检查报告作为实验数据集,通过实验验证本文所提出方法的有效性和可行性。实验表明,该方法能够达到预期目标,为后续的研究打下了基础。
【图文】:

模型图,模型,中心词


2Vec 是 Google 研究员 Tomas Mikolov 于 2013 年发布的一。Word2Vec 根据给定的语料库,通过训练可以把对文本词量空间中的向量运算,,用向量空间上的相似度来表示词语Word2Vec 输出的词向量可以被用来做很多自然语义处理领词替换、聚类等。2Vec 主要有两种模型: Continuous Bag-of-Words (CBOs Skip-gram (Skip-gram)模型[39][40]。在训练过程中,Word2Vampling 和 Hierarchical Softmax 方法,来提高词向量的训练。下面将详细介绍 CBOW 模型和 Skip-gram 模型。BOW 模型W 模型根据中心词的上下文来预测中心词。对于中心词 的 2k 个词 , +1,..., + +1, + 来预测 ,其口大小。模型的预测目标如公式(2-1)所示: ( | , +1, … , + +1, + )

模型图,模型,实体,文本


图 2-2 Skip-gram 模型-gram 模型结构如图 2-2 所示,与 CBOW 模型类似,由输入层组成。第一层为输入层,输入中心词 ;第二层为投影层,;第三层为输出层,输出上下文 2k 个词的概率值。采用 Word2Vec 工具,通过 Skip-gram 模型把文本中的词特征使用 Negatve Sampling 方法进行优化,用向量间的余弦值表示建同义词表,并对超声文本中的同义词做替换,以消除一义实体识别实体识别(Named Entity Recognition,NER)即实体识别,采机器学习等方法,对文本中具体实体进行识别并区分其种类在自然语言处理和信息抽取领域中有着广泛的应用意义和研-6 将命名实体作为明确的概念提出,MUC-7 规定了命名实体、时间类、数字类)和七小类(人名、地名、机构名、时间、
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;R445.1;R655.8

【相似文献】

相关期刊论文 前10条

1 ;2017-2020年《陕西学前师范学院学报》选题领域本体(第41组)公告第四十一组:儿童社会能力发展[J];陕西学前师范学院学报;2019年12期

2 ;2017-2020年《陕西学前师范学院学报》选题领域本体(033)公告[J];陕西学前师范学院学报;2019年03期

3 ;2017-2020年《陕西学前师范学院学报》选题领域本体(034)公告[J];陕西学前师范学院学报;2019年03期

4 ;2017-2020年《陕西学前师范学院学报》选题领域本体(019)公告[J];陕西学前师范学院学报;2018年01期

5 ;2017-2020年《陕西学前师范学院学报》选题领域本体(022)公告 第二十二组:教师教育与管理[J];陕西学前师范学院学报;2018年05期

6 ;2017-2020年陕西学前师范学院学报选题领域本体(024)公告 第二十四组 基础理论研究[J];陕西学前师范学院学报;2018年06期

7 ;2017-2020年陕西学前师范学院学报选题领域本体(026-027)公告[J];陕西学前师范学院学报;2018年07期

8 ;2017-2020年陕西学前师范学院学报选题领域本体(028)公告[J];陕西学前师范学院学报;2018年07期

9 ;2017-2020年陕西学前师范学院学报选题领域本体(029)公告 第二十九组 课程改革与发展[J];陕西学前师范学院学报;2018年08期

10 ;2017-2020年陕西学前师范学院学报选题领域本体(030)公告 第三十组 儿童自然教育[J];陕西学前师范学院学报;2018年08期

相关会议论文 前10条

1 叶琼;李绍稳;张友华;刘恺;;农业领域本体知识的云化方法研究[A];中国农业工程学会2011年学术年会论文集[C];2011年

2 张士靖;胡兆芹;;医学领域本体的构建实践[A];中华医学会第十二次全国医学信息学术会议论文汇编[C];2006年

3 张驰;潘懋;郭艳军;陈曦;刘庆彬;;一种基于领域本体树和关键词组的地质资料相关度计算模型[A];第十五届全国数学地质与地学信息学术研讨会论文集[C];2016年

4 吴国祥;谢丽聪;白清源;谢伙生;张莹;;领域本体在文本分类中的应用[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

5 冯兰萍;朱礼军;张继国;;一种基于Web应用的领域本体构造方法研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

6 吴松飞;申琪玉;王亮;吴观众;张昊天;吉嘉;邓逸川;;基于建筑领域本体的BIM族库模糊语义检索研究[A];第二届全国BIM学术会议论文集[C];2016年

7 杨东;童立新;叶艳;;一种电子政务本体的分析、获取和表示方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年

8 真溱;唐爱民;沈钧毅;卢胜军;;基于叙词表构建军用飞机领域本体原型(英文)[A];全国语域web与本体能研讨会论文集[C];2006年

9 印康;谷俊;;钢铁本体的构建方法研究[A];第十届中国钢铁年会暨第六届宝钢学术年会论文集III[C];2015年

10 李勇;李晓峰;;面向领域知识库的电信业务本体创建[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

相关博士学位论文 前10条

1 顾芳;多学科领域本体设计方法的研究[D];中国科学院研究生院(计算技术研究所);2004年

2 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年

3 宋峻峰;面向语义Web的领域本体表示、推理、集成及其应用研究[D];国防科学技术大学;2006年

4 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年

5 刘紫玉;多专业领域本体的构建及语义检索研究[D];北京交通大学;2010年

6 张睿;基于领域本体的语义扩展检索算法的研究与应用[D];山东师范大学;2015年

7 邢军;领域本体构造中数据源选取及构造方法的研究[D];大连理工大学;2008年

8 刁丽娟;通用本体学习方法及其应用的关键技术研究[D];华东师范大学;2015年

9 吴镝;面向RP领域的Web服务自主组建方法研究与应用[D];上海大学;2011年

10 赵继春;农民现代远程教育个性化学习关键技术研究[D];中国农业科学院;2016年

相关硕士学位论文 前10条

1 李晗;航空安全事件文本信息关系提取方法的研究[D];中国民航大学;2019年

2 刘淑君;领域本体驱动的乳腺超声检查报告结构化研究与实现[D];东华大学;2019年

3 张雪娜;基于文档检索和语义关系识别的石油领域本体自动化构建[D];中国石油大学(华东);2017年

4 钟浩健;基于跨领域本体互联的数据融合平台[D];上海交通大学;2017年

5 陈成;孕产健康领域本体可视化模型的研究与应用[D];江苏大学;2019年

6 李斌;基于领域本体与谱聚类的按需服务发现方法研究[D];河南大学;2018年

7 李霞;基于领域本体的白族服饰信息分类体系及检索研究[D];云南师范大学;2018年

8 甄亚亚;领域本体的语义检索模型研究[D];武汉理工大学;2017年

9 何述芳;基于领域本体的网络评论多层次细粒度情感挖掘[D];江苏大学;2018年

10 王雪君;基于领域本体的分布式RDF图数据存储及应用研究[D];中国民航大学;2018年



本文编号:2638062

资料下载
论文发表

本文链接:https://www.wllwen.com/linchuangyixuelunwen/2638062.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户440c7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com