基于模板树的甲状腺超声报告结构化系统设计与实现
发布时间:2020-12-02 19:05
甲状腺控制着人体的代谢活动,影响人体的每个器官功能。近年来,从医院的统计数据来看,患甲状腺疾病的人数逐年增加,严重影响人们的健康和正常生活。因此,如何治疗甲状腺疾病引起了全球范围的关注。在甲状腺临床治疗中,由于甲状腺超声报告包含了甲状腺腺体背景、局灶性病变和颈部淋巴结等大量检查信息,因此它成为了甲状腺疾病临床诊断的主要依据。医生依据超声报告的结果,凭借自身的医学知识和临床经验对甲状腺结节良恶性等疾病类型进行病理诊断。但是,由于实际中不同医生的医学知识水平和临床经验存在差异性,在一定程度上会造成疾病的误诊。近年来,随着人工智能等技术的发展,人们尝试利用计算机获取并分析检查报告中的内容。临床中的甲状腺超声报告文本大多以非结构化、半结构化的形式进行存储,由于无法直接从中得到相应的医疗信息,很难将这些数据直接用于医疗统计分析和人工智能模型构建中。所以,类似甲状腺超声的医疗检查文本报告的结构化成为了医疗人工智能领域研究的首要问题。本文提出了一种基于模板树的甲状腺超声报告结构化方法,该方法中的模板树可以通过对大量甲状腺超声报告中的词性和句法关系的分析进行自动构建,然后通过对模板树的扫描,实现了甲状...
【文章来源】:东华大学上海市 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
B=7,L=5的CF聚类特征树
图 2-2 BIRCH 算法流程图技术实体识别技术,从甲状腺超声报告训练集中提取器官词值各种实体,完成甲状腺超声报告词性词典的建立。为模用模板树进行结构化提供词性支持。随着深度学习的不断发展,深度学习广泛应用于各领域,面。深度学习模型如 RNN、LSTM 都具有出色的序列建自然语言中的上下文关系信息的目的,同时具备神经网络于甲状腺超声报告中的文本之间互相关联,为了更好保存息,本文使用深度学习中的双向 Bi-LSTM+CRF 的实体识完成对甲状腺超声报告的命名实体识别。此模型通过对甲和后向序列分别进行处理,利用 LSTM 两个单独的隐藏来信息,然后连接两个隐藏状态以形成最终输出,流程
图 2-3 Bi-LSTM + CRF 模型流程图第一层即文字向量输入层。将文本序列中的每个汉字利用预先训练好的字向进行字向量编码并向量化,作为 Bi-LSTM 层的输入。第二层即双向 LSTM 层。在这层将提取每个输入的句子特征,将句子中的每个字的字向量的序列作为双向 LSTM 各个时间点的输入。再将正向 LSTM 输的隐状序列与反向 LSTM 的在各个位置输出状态按位置进行拼接,得到完整隐状态序列。第三层即 CRF 层。在经过双向 LSTM 层之后,使用 CRF 层进行 decode 即解,将 Bi-LSTM 层提取到的特征作为输入,然后通过 CRF 层进行解码,从此层输入特征序列中计算每一个元素所属的标签。在 CRF 层计算每一个元素所属的标签的方法是:CRF 层通过算法计算从 Bi-TM 层提取得到的文本序列 X=(x1,x2,…,xn)的特征的联合概率。定义大小为 n*m Bi-LSTM 输出的概率矩阵,句子中的词语数目为 n,句子中的标签数目为 m,表示句子中第 i 个词的标签 j 的打分。因此,预测序列 X 对应的标签 L(l1,l3,……ln)的打分公式如式(2-2)所示。
【参考文献】:
期刊论文
[1]超声在甲状腺良恶性结节诊断中的应用[J]. 周祖荣. 影像研究与医学应用. 2019(05)
[2]基于E-CNN和BLSTM-CRF的临床文本命名实体识别[J]. 曹春萍,关鹏举. 计算机应用研究. 2019(12)
[3]依存句法分析方法综述[J]. 杨振鹏. 无线互联科技. 2018(22)
[4]基于LSTM-CRF命名实体识别技术的研究与应用[J]. 张聪品,方滔,刘昱良. 计算机技术与发展. 2019(02)
[5]国外生物医学文本语料库分类及特点研究[J]. 晏归来,安新颖,范少萍,周永称. 医学信息学杂志. 2018(10)
[6]生物医学命名实体识别研究现状及中文生物医学命名实体识别难点与意义综述[J]. 潘璀然,施维,薛均,王青华,王理,董建成. 医学信息学杂志. 2018(03)
[7]命名实体识别研究综述[J]. 刘浏,王东波. 情报学报. 2018(03)
[8]基于深度神经网络的命名实体识别方法研究[J]. GUL Khan Safi Qamas,尹继泽,潘丽敏,罗森林. 信息网络安全. 2017(10)
[9]B超诊断甲状腺结节性病变的应用价值[J]. 常虹,徐维华. 影像研究与医学应用. 2017(10)
[10]基于Spark的BIRCH算法并行化的设计与实现[J]. 李帅,吴斌,杜修明,陈玉峰. 计算机工程与科学. 2017(01)
博士论文
[1]汉语依存句法分析关键技术研究[D]. 李正华.哈尔滨工业大学 2013
硕士论文
[1]面向医疗领域的命名实体识别[D]. 栗冬冬.哈尔滨理工大学 2018
[2]电子病历数据的结构化分析与研究[D]. 张立君.青岛科技大学 2018
[3]基于句法结构的术语关系抽取方法研究[D]. 周雯.北京交通大学 2017
[4]基于依存句法分析的超声检查报告结构化处理方法[D]. 田驰远.东华大学 2017
[5]基于纯文本的领域本体构建与实现[D]. 郭瑞.河北科技大学 2016
[6]基于领域词典的移动医疗问题分类与问题相似度计算[D]. 尹京伟.深圳大学 2016
[7]基于递归神经网络的生物医学命名实体识别[D]. 金留可.大连理工大学 2016
[8]基于词典与机器学习的基因命名实体识别机制研究[D]. 夏光辉.北京协和医学院 2013
[9]基于BIRCH改进算法的文本聚类研究[D]. 仰孝富.北京林业大学 2013
本文编号:2895586
【文章来源】:东华大学上海市 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
B=7,L=5的CF聚类特征树
图 2-2 BIRCH 算法流程图技术实体识别技术,从甲状腺超声报告训练集中提取器官词值各种实体,完成甲状腺超声报告词性词典的建立。为模用模板树进行结构化提供词性支持。随着深度学习的不断发展,深度学习广泛应用于各领域,面。深度学习模型如 RNN、LSTM 都具有出色的序列建自然语言中的上下文关系信息的目的,同时具备神经网络于甲状腺超声报告中的文本之间互相关联,为了更好保存息,本文使用深度学习中的双向 Bi-LSTM+CRF 的实体识完成对甲状腺超声报告的命名实体识别。此模型通过对甲和后向序列分别进行处理,利用 LSTM 两个单独的隐藏来信息,然后连接两个隐藏状态以形成最终输出,流程
图 2-3 Bi-LSTM + CRF 模型流程图第一层即文字向量输入层。将文本序列中的每个汉字利用预先训练好的字向进行字向量编码并向量化,作为 Bi-LSTM 层的输入。第二层即双向 LSTM 层。在这层将提取每个输入的句子特征,将句子中的每个字的字向量的序列作为双向 LSTM 各个时间点的输入。再将正向 LSTM 输的隐状序列与反向 LSTM 的在各个位置输出状态按位置进行拼接,得到完整隐状态序列。第三层即 CRF 层。在经过双向 LSTM 层之后,使用 CRF 层进行 decode 即解,将 Bi-LSTM 层提取到的特征作为输入,然后通过 CRF 层进行解码,从此层输入特征序列中计算每一个元素所属的标签。在 CRF 层计算每一个元素所属的标签的方法是:CRF 层通过算法计算从 Bi-TM 层提取得到的文本序列 X=(x1,x2,…,xn)的特征的联合概率。定义大小为 n*m Bi-LSTM 输出的概率矩阵,句子中的词语数目为 n,句子中的标签数目为 m,表示句子中第 i 个词的标签 j 的打分。因此,预测序列 X 对应的标签 L(l1,l3,……ln)的打分公式如式(2-2)所示。
【参考文献】:
期刊论文
[1]超声在甲状腺良恶性结节诊断中的应用[J]. 周祖荣. 影像研究与医学应用. 2019(05)
[2]基于E-CNN和BLSTM-CRF的临床文本命名实体识别[J]. 曹春萍,关鹏举. 计算机应用研究. 2019(12)
[3]依存句法分析方法综述[J]. 杨振鹏. 无线互联科技. 2018(22)
[4]基于LSTM-CRF命名实体识别技术的研究与应用[J]. 张聪品,方滔,刘昱良. 计算机技术与发展. 2019(02)
[5]国外生物医学文本语料库分类及特点研究[J]. 晏归来,安新颖,范少萍,周永称. 医学信息学杂志. 2018(10)
[6]生物医学命名实体识别研究现状及中文生物医学命名实体识别难点与意义综述[J]. 潘璀然,施维,薛均,王青华,王理,董建成. 医学信息学杂志. 2018(03)
[7]命名实体识别研究综述[J]. 刘浏,王东波. 情报学报. 2018(03)
[8]基于深度神经网络的命名实体识别方法研究[J]. GUL Khan Safi Qamas,尹继泽,潘丽敏,罗森林. 信息网络安全. 2017(10)
[9]B超诊断甲状腺结节性病变的应用价值[J]. 常虹,徐维华. 影像研究与医学应用. 2017(10)
[10]基于Spark的BIRCH算法并行化的设计与实现[J]. 李帅,吴斌,杜修明,陈玉峰. 计算机工程与科学. 2017(01)
博士论文
[1]汉语依存句法分析关键技术研究[D]. 李正华.哈尔滨工业大学 2013
硕士论文
[1]面向医疗领域的命名实体识别[D]. 栗冬冬.哈尔滨理工大学 2018
[2]电子病历数据的结构化分析与研究[D]. 张立君.青岛科技大学 2018
[3]基于句法结构的术语关系抽取方法研究[D]. 周雯.北京交通大学 2017
[4]基于依存句法分析的超声检查报告结构化处理方法[D]. 田驰远.东华大学 2017
[5]基于纯文本的领域本体构建与实现[D]. 郭瑞.河北科技大学 2016
[6]基于领域词典的移动医疗问题分类与问题相似度计算[D]. 尹京伟.深圳大学 2016
[7]基于递归神经网络的生物医学命名实体识别[D]. 金留可.大连理工大学 2016
[8]基于词典与机器学习的基因命名实体识别机制研究[D]. 夏光辉.北京协和医学院 2013
[9]基于BIRCH改进算法的文本聚类研究[D]. 仰孝富.北京林业大学 2013
本文编号:2895586
本文链接:https://www.wllwen.com/yixuelunwen/nfm/2895586.html
最近更新
教材专著