当前位置:主页 > 科技论文 > 软件论文 >

离群点检测算法的研究及其在电子病历处方数据异常检测中的应用

发布时间:2023-06-01 19:33
  数据挖掘是从结构复杂的大规模数据中挖掘出有规律性的、突出意义的且不容易被人们所发现的有价值的可以理解的信息的技术。而离群点检测是数据挖掘领域中的重要课题之一,随着现实生活、互联网等产生的数据越来越多,数据结构越来越复杂,离群点检测迎来了新的难题。本文通过研究分析目前离群点检测算法中存在的问题,对离群点检测算法进行改进,使改进后的离群点检测更加适用于电子病历临床处方异常数据的检测,从而有效地利用医院信息化建设中积累的大量数据,及时检测出临床处方中的异常数据。本文的主要研究内容如下:(1)对自组织映射神经网络聚类算法进行改进,在训练过程中的权值调整公式中加入获胜系数对权值调整的影响,加快算法收敛速度,并且减小由输入顺序所带来的对训练结果的影响。定义反应网络收敛程度的参考函数,根据参考函数对学习率函数进行调整,并将获胜系数引入学习率函数,使算法能自适应的找到当前最适应的学习率,在保证准确率的情况下加快收敛速度。(2)对传统局部异常因子算法进行改进,将“朋友关系”模型引入,提出基于反向近邻密度的局部异常因子算法,重新定义局部异常因子。以解决某些情况下特殊的数据分布会导致LOF算法将正常数据点误...

【文章页数】:70 页

【学位级别】:硕士

【文章目录】:
中文摘要
英文摘要
1 绪论
    1.1 课题的研究背景与意义
    1.2 国内外研究现状
    1.3 论文的研究内容与创新
    1.4 本论文的结构安排
2 相关技术概述
    2.1 离群点概述
        2.1.1 离群点的定义
        2.1.2 离群点的种类
        2.1.3 离群点检测算法
    2.2 相关聚类算法概述
        2.2.1 聚类算法相关距离度量与相关系数介绍
        2.2.2 K-均值聚类算法
        2.2.3 DBSCAN密度聚类算法
        2.2.4 自组织映射神经网络聚类算法
        2.2.5 聚类算法衡量指标
    2.3 本章小节
3 自组织映射神经网络聚类算法研究
    3.1 自组织映射神经网络聚类算法的改进
        3.1.1 自组织映射神经网络结构分析
        3.1.2 自组织映射神经网络算法的推导
        3.1.3 基于获胜系数的自组织映射神经网络聚类算法
    3.2 实验结果及分析
        3.2.1 实验数据集
        3.2.2 实验结果分析比较
    3.3 本章小结
4 基于改进的SOM聚类算法的离群点检测算法
    4.1 离群点检测算法的改进
        4.1.1 基于聚簇中心的排序选择算法降低数据量级
        4.1.2 “朋友关系”模型的引入
        4.1.3 基于反向近邻密度的局部异常因子算法
    4.2 实验结果及分析
        4.2.1 实验数据集
        4.2.2 实验结果分析比较
    4.3 本章小结
5 电子病历临床处方异常数据检测
    5.1 临床处方数据预处理
        5.1.1 临床处方数据概况
        5.1.2 临床处方数据矩阵整理
        5.1.3 临床处方数据归一化处理
        5.1.4 临床处方数据降维
    5.2 实验结果及分析
        5.2.1 实验数据集
        5.2.2 实验结果分析比较
    5.3 本章小结
6 总结与展望
参考文献
附录
    A.作者在攻读学位期间发表的论文目录
    C.学位论文数据集
致谢



本文编号:3826911

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3826911.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89fc6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com