基于注意力机制的疾病预测关键技术研究
发布时间:2021-06-07 16:05
伴随着医疗行业信息化的发展,产生了越来越多的医疗健康数据。医疗健康大数据的挖掘与应用也成为了必然趋势。人们生活水平和健康意识的提高使得人们对疾病的治疗和预防提出了更高的要求;国家也提出了疾病要以预防为主,强调要治未病。电子健康记录(Electronic Health Records,EHR)中包含着患者的患病情况、治疗信息以及人口统计学信息等。通过对这些数据的挖掘分析能够完成疾病预测任务,从而帮助医生实现疾病的预防,提高医疗服务质量。在利用电子健康记录进行疾病预测任务时仍存在着一些问题需要解决。首先是电子健康记录中存在数据不一致问题,电子健康记录中的诊断信息通过医学代码来进行记录。在进行医学代码分配的过程中,社会歧视、编码不规范等很多原因都会导致错误医学代码出现,比如很多癫痫数据都被记录为高热惊厥。这种编码错误会导致诊断信息和药物信息数据不一致,影响最终的预测任务。此外,患者的历史就医信息本身数据量很大,并且是高维的时序数据。这些特性使得传统的机器学习算法对数据的建模效果不佳。尽管已经有研究人员将循环神经网络等深度学习模型应用到疾病预测任务中,但仍然存在一些问题导致模型效果不是很理想。...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图2-1疾病预测任务流程??9??
?山东大学硕士学位论文???性。一些数据的医疗特性与记录不同。由于某些疾病通常与社会歧视相关,因??此医生倾向于使用其他类似疾病来避免这种耻辱感。??癫痫患者?高热惊厥患者??#?0?像?▲?▲??#?m?a?M?a?A???????▲▲?▲?▲??o?m?a??m?.A???A?A?A??A?A?A??■被医生记录为癫痫??A被医生记录为高热惊厥??图2-2错误标记示例??由歧视引起的典型医疗代码错误是中国的癫痫病例,如图2-2所示。癫痫??的发病率通常是根据每年100,000人中新发现的癫痫患者人数的比例来计算的。??根据世界卫生组织的数据[32】,高收入国家的发病人数是49,低收入和中等收入??国家的发病人数是139。相比之下,中国的发病人数为28.9。从以上数据可以??看出,中国癫痫的发病率明显低于国外。但事实并非如此。癫痫病是一种常见??的中枢神经系统疾玻国际癫痫局的调查显示,中国许多父母或患者倾向于隐??瞒自己的病情[33]。尽管在控制癫痫发作方面取得了进展,但癫痫患者仍会遭受??耻辱和歧视I34.35】。因此,在EHR数据中,高热惊厥或其他相关疾病经常被用来??代替癫痫作为诊断结果,如图3-2所示。这将导致医学特征和疾病名称的不一??致,即医学概念上的不一致。许多现有方法使用临床记录作为ICD代码的唯一??信息来源,这些方法通常使用自然语言处理来从临床记录中提取患者的症状、??用药、疾病描述和其他相关信息。但是,如果医生有意帮助患者掩盖疾病,通??过临床记录很难正确提取准确的疾病信息。这就导致医学概念的不一致性是不??可避免的。??除了这类医生故意产生的代码错误之外,还
?山东大学硕士学位论文???^Knowledge?base^??,??embedding?'一\??卜?n?e/?、?rn???1——、??x2? ̄ ̄|?e:,?、、〇i???——??...-????...?-二——??j/?-?尸一?y????厂??'丨???Pn-I????■Y”"?Q-Q?e^r?’?f,n??y,?I□口?e”丨?丨??l^i?H?h:?j??、—?J??图3*4KEAM模型结构图??3.2.2嵌入表示模块??假设Cd表示唯一药物代码的数量,根据one-hot编码,每种药物可以用Cd??维数的二进制矢量表示。因此,药物D,可以表示为-?个向量\£{0,1}^1,只有??第i维为1。如果在一次患者就诊中医生规定了?n种药物,则就诊药物信息可以??表示为大小为〃\心的矩阵。??我们基于ATC的内部结构,通过使用父节点和同级节点的信息来帮助叶子??节点学习嵌入。在我们的方法中,如图3-5所示,仅将叶节点和父节点的信息??用作双向GRU?(Bi-GRU)的输入,这避免了在其他类型药物上合并过多信息??并确保药物表达的特异性。Bi-GRU由前向GRU和后向GRU组成。他们分别??从正向和反向读取输入序列。我们通过将两个GRU的隐藏状态结合在一起来获??得药物表示向量。??Q2E33I?>?h;?!?!i2??____?——??...?C03CA02??>?h|?I?|?hi?1????V?J??ATC?Code?Bi-GRU??图3-5?KEAM模型嵌入表示模块??21??
【参考文献】:
期刊论文
[1]基于电子病历大数据分析的疾病预测建模[J]. 陈可. 中国数字医学. 2018(03)
[2]基于电子病历数据挖掘的疾病危重度动态预测研究[J]. 李季,丁凤一,李翔宇. 信息资源管理学报. 2017(04)
[3]普适医疗信息管理与服务的关键技术与挑战[J]. 吴信东,叶明全,胡东辉,吴共庆,胡学钢,王浩. 计算机学报. 2012(05)
[4]BP神经网络在疾病预测中的应用[J]. 王俊杰,陈景武. 数理医药学杂志. 2008(03)
硕士论文
[1]基于体检数据的慢性疾病风险预测研究[D]. 谭恒.郑州大学 2016
本文编号:3216882
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图2-1疾病预测任务流程??9??
?山东大学硕士学位论文???性。一些数据的医疗特性与记录不同。由于某些疾病通常与社会歧视相关,因??此医生倾向于使用其他类似疾病来避免这种耻辱感。??癫痫患者?高热惊厥患者??#?0?像?▲?▲??#?m?a?M?a?A???????▲▲?▲?▲??o?m?a??m?.A???A?A?A??A?A?A??■被医生记录为癫痫??A被医生记录为高热惊厥??图2-2错误标记示例??由歧视引起的典型医疗代码错误是中国的癫痫病例,如图2-2所示。癫痫??的发病率通常是根据每年100,000人中新发现的癫痫患者人数的比例来计算的。??根据世界卫生组织的数据[32】,高收入国家的发病人数是49,低收入和中等收入??国家的发病人数是139。相比之下,中国的发病人数为28.9。从以上数据可以??看出,中国癫痫的发病率明显低于国外。但事实并非如此。癫痫病是一种常见??的中枢神经系统疾玻国际癫痫局的调查显示,中国许多父母或患者倾向于隐??瞒自己的病情[33]。尽管在控制癫痫发作方面取得了进展,但癫痫患者仍会遭受??耻辱和歧视I34.35】。因此,在EHR数据中,高热惊厥或其他相关疾病经常被用来??代替癫痫作为诊断结果,如图3-2所示。这将导致医学特征和疾病名称的不一??致,即医学概念上的不一致。许多现有方法使用临床记录作为ICD代码的唯一??信息来源,这些方法通常使用自然语言处理来从临床记录中提取患者的症状、??用药、疾病描述和其他相关信息。但是,如果医生有意帮助患者掩盖疾病,通??过临床记录很难正确提取准确的疾病信息。这就导致医学概念的不一致性是不??可避免的。??除了这类医生故意产生的代码错误之外,还
?山东大学硕士学位论文???^Knowledge?base^??,??embedding?'一\??卜?n?e/?、?rn???1——、??x2? ̄ ̄|?e:,?、、〇i???——??...-????...?-二——??j/?-?尸一?y????厂??'丨???Pn-I????■Y”"?Q-Q?e^r?’?f,n??y,?I□口?e”丨?丨??l^i?H?h:?j??、—?J??图3*4KEAM模型结构图??3.2.2嵌入表示模块??假设Cd表示唯一药物代码的数量,根据one-hot编码,每种药物可以用Cd??维数的二进制矢量表示。因此,药物D,可以表示为-?个向量\£{0,1}^1,只有??第i维为1。如果在一次患者就诊中医生规定了?n种药物,则就诊药物信息可以??表示为大小为〃\心的矩阵。??我们基于ATC的内部结构,通过使用父节点和同级节点的信息来帮助叶子??节点学习嵌入。在我们的方法中,如图3-5所示,仅将叶节点和父节点的信息??用作双向GRU?(Bi-GRU)的输入,这避免了在其他类型药物上合并过多信息??并确保药物表达的特异性。Bi-GRU由前向GRU和后向GRU组成。他们分别??从正向和反向读取输入序列。我们通过将两个GRU的隐藏状态结合在一起来获??得药物表示向量。??Q2E33I?>?h;?!?!i2??____?——??...?C03CA02??>?h|?I?|?hi?1????V?J??ATC?Code?Bi-GRU??图3-5?KEAM模型嵌入表示模块??21??
【参考文献】:
期刊论文
[1]基于电子病历大数据分析的疾病预测建模[J]. 陈可. 中国数字医学. 2018(03)
[2]基于电子病历数据挖掘的疾病危重度动态预测研究[J]. 李季,丁凤一,李翔宇. 信息资源管理学报. 2017(04)
[3]普适医疗信息管理与服务的关键技术与挑战[J]. 吴信东,叶明全,胡东辉,吴共庆,胡学钢,王浩. 计算机学报. 2012(05)
[4]BP神经网络在疾病预测中的应用[J]. 王俊杰,陈景武. 数理医药学杂志. 2008(03)
硕士论文
[1]基于体检数据的慢性疾病风险预测研究[D]. 谭恒.郑州大学 2016
本文编号:3216882
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3216882.html
最近更新
教材专著