当前位置:主页 > 医学论文 > 医卫管理论文 >

电子病历数据的结构化分析与研究

发布时间:2023-05-07 01:09
  随着信息技术的不断深入发展,数据的分析与研究成果逐步应用于社会发展的各个领域。在医学领域,电子病历数据的结构化分析与研究也逐步受到了科研人员的青睐,成为医学领域研究的首要工作。电子病历(Electronic Medical Records,EMR)产生于临床治疗过程中,包含了个人全部的健康信息和就诊过程,蕴藏着大量与个人健康状况密切相关的医疗知识,对电子病历中命名实体的识别和抽取是医学领域重要的数据研究内容。电子病历中非结构化的文本数据占有绝大部分,然而非结构化数据并不能被计算机自动分析处理,在一定程度上阻碍了医学知识的挖掘和知识发现。因此,本文主要从以下几个方面开展工作:(一)通过研究大量电子病历数据,标注、分析、统计、添加等工作整理出自定义医学词典,同时,通过动态删除算法改进了N-最短路径分词方法。通过对中文分词词典和方法的优化,兼顾了分词的速度和质量。(二)本文根据电子病历的特点,提出了一种基于双重标注的隐马尔科夫模型的电子病历命名实体识别方法,对病历文本同时标注基本词性和实体类型,优化隐马尔科夫模型的解码问题,从而提高电子病历文本中命名实体识别的准确率。(三)本文根据电子病历的...

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
1 绪论
    1.1 课题背景、目的及研究意义
        1.1.1 课题研究背景
        1.1.2 课题研究目的
        1.1.3 课题研究意义
    1.2 国内外研究现状
    1.3 课题的研究内容
    1.4 本文内容安排
2 中文电子病历研究的相关理论和技术
    2.1 中文电子病历的相关概念
        2.1.1 中文电子病历实体的分类
        2.1.2 中文电子病历的特点分析
    2.2 中文文本分词的主要方法
    2.3 中文命名实体识别的主要方法
        2.3.1 基于词典的命名实体识别方法
        2.3.2 基于规则的命名实体识别方法
        2.3.3 基于统计机器学习的命名实体识别方法
    2.4 本文相关算法理论研究
        2.4.1 N-最短路径算法理论
        2.4.2 隐马尔科夫模型理论
        2.4.3 最大熵模型理论
    2.5 本章小结
3 中文电子病历实体识别及其相关修饰信息抽取
    3.1 中文电子病历文本数据的预处理
        3.1.1 数据预处理
        3.1.2 文本预处理
        3.1.3 基于自定义词典的N-最短路径分词方法的改进
    3.2 中文电子病历命名实体识别
        3.2.1 基于隐马尔科夫模型的命名实体识别
        3.2.2 中文电子病历实体识别实验与分析
    3.3 中文电子病历文本依存句法分析
        3.3.1 基于最大熵模型的依存句法分析
        3.3.2 中文电子病历依存句法实验与分析
    3.4 本章小结
4 电子病历数据的结构化规范
    4.1 面向信息检索的文本型结构化数据
    4.2 面向数据挖掘的数值型结构化数据
    4.3 面向临床决策支持的向量型结构化数据
    4.4 本章小结
5 电子病历数据的结构化分析系统
    5.1 系统开发环境介绍
    5.2 系统结构
    5.3 系统模块说明
    5.4 本章小结
总结与展望
参考文献
致谢
攻读学位期间发表的学术论文目录
攻读学位期间参加的科研项目



本文编号:3809950

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3809950.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f60ca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com