基于多维属性探索深度学习的多尺度疾病诊断预测研究
发布时间:2021-06-18 11:05
随着科学技术的日新月异,医疗健康事业的蓬勃发展,疾病的诊断和治疗也越来越科学化和规范化。不过现阶段的医疗诊断主要是依靠医生的专业知识和丰富的临床经验。伴随着健康医疗事业的发展,健康医疗数据的规模也越来越大,从这些数据中可以挖掘疾病的相关信息。电子健康档案本身包含着丰富的病人相关信息,如个人信息,具体的患病以及用药情况。这些信息会对病人未来疾病的预测起到帮助作用,进而对医疗决策提供诊断辅助。《“健康中国2030”规划纲要》也明确指出,推进健康中国建设,要坚持预防为主,强化早诊断、早治疗、早康复。疾病诊断预测的研究可以来解决上述问题,提高医疗服务水平。同时疾病诊断预测也是精准医疗的核心关键技术。根据病人的电子健康档案进行诊断预测仍然存在一些问题未能得到很好的解决。电子健康档案本身存在数据量大,维度高,存在缺失和噪声,时序性等特性。这些特性使得使用传统的机器学习算法来解决疾病诊断预测问题的效果不佳。一些人将深度学习模型如循环神经网络等应用到疾病诊断预测中去,取得了不错的效果。但仍存在一些问题,如未对电子健康档案数据进行充分的利用,模型的性能并不是非常理想。针对当前的研究现状,本文从数据广度和...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图3-1年龄与就医率的关系图??该图是数据集跨度从2014年7月29日到2015年7月29日这一年的时间间??
山东大学硕士学位论文??和药品编码组合起来的医学编码,第T次则使用疾病编码分组信息。??所有人的就医次数如图3-2所示。??12000?4?——??10000?-??8000?-?I??DH??^?6000-??m??4000?-??2000?-?-??Q?1???—?^??0?10?20?30?40?50?60??就医次数??图3-2就医次数与就医人数的关系图??图3-2的x轴表示不同的就医数量,而y轴表示该就医次数的疾病就医的患??者数量。因为超过60次就医的病人数量较少,图中只展示了就医次数小于60次??的部分。从图中可以看出,大多数人的医疗次数在2到20次之间,很少有人的就??医次数在40到60次之间。因此图中就医次数在40到60之间的显示不是很明显。??经过处理后的数据集描述如下表3-5所示。???表3-5基于下f就医的数据集描述????病人数g?35308?病人就医最小次数?2??病人就医总次数?314933?诊断编码数目?]332??病人就医平均次数?8.91?药品编码数目?1125??病人就医最大次数?192?诊断编码分组数目?612??通过表3-4可以看出,数据集病人的人数约为3.5万人,病人的就医总次数为??31万次,平均每人的就医次数为9次。该数据量可以满足了循环神经网络对数据??时序性的需求。??3.6本章小结??18??
山东大学硕士学位论文?如图4-1所示的模型由“RNN-INFO”命名,因为它结合了就医的顺序信息统计信息来进行预测。模型的输入包含三个部分:诊断向量心,药品向量??统计学信息g。诊断向量和药品向量是multi-hot向量,将被连接到名为A的量将按时间顺序输入。设置隐藏层的目的为减少维度并获得数据的隐藏表
本文编号:3236548
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图3-1年龄与就医率的关系图??该图是数据集跨度从2014年7月29日到2015年7月29日这一年的时间间??
山东大学硕士学位论文??和药品编码组合起来的医学编码,第T次则使用疾病编码分组信息。??所有人的就医次数如图3-2所示。??12000?4?——??10000?-??8000?-?I??DH??^?6000-??m??4000?-??2000?-?-??Q?1???—?^??0?10?20?30?40?50?60??就医次数??图3-2就医次数与就医人数的关系图??图3-2的x轴表示不同的就医数量,而y轴表示该就医次数的疾病就医的患??者数量。因为超过60次就医的病人数量较少,图中只展示了就医次数小于60次??的部分。从图中可以看出,大多数人的医疗次数在2到20次之间,很少有人的就??医次数在40到60次之间。因此图中就医次数在40到60之间的显示不是很明显。??经过处理后的数据集描述如下表3-5所示。???表3-5基于下f就医的数据集描述????病人数g?35308?病人就医最小次数?2??病人就医总次数?314933?诊断编码数目?]332??病人就医平均次数?8.91?药品编码数目?1125??病人就医最大次数?192?诊断编码分组数目?612??通过表3-4可以看出,数据集病人的人数约为3.5万人,病人的就医总次数为??31万次,平均每人的就医次数为9次。该数据量可以满足了循环神经网络对数据??时序性的需求。??3.6本章小结??18??
山东大学硕士学位论文?如图4-1所示的模型由“RNN-INFO”命名,因为它结合了就医的顺序信息统计信息来进行预测。模型的输入包含三个部分:诊断向量心,药品向量??统计学信息g。诊断向量和药品向量是multi-hot向量,将被连接到名为A的量将按时间顺序输入。设置隐藏层的目的为减少维度并获得数据的隐藏表
本文编号:3236548
本文链接:https://www.wllwen.com/linchuangyixuelunwen/3236548.html
最近更新
教材专著