当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于集成学习的中医病案数据挖掘方法研究

发布时间:2020-05-25 10:09
【摘要】:随着计算机科学技术和信息技术的发展,中医药学也顺应潮流逐渐实现信息化和现代化。其中,中医症状-证型的辩证分类技术获得广泛关注并取得相应发展,是当前中医药领域主要的研究课题之一。由于中医病案数据具有复杂性、模糊性和不确定性等问题,使得传统单一的分类挖掘无法确保对所有信息的综合考量。而考虑到集成学习具有较高分类准确率和较好的泛化性能,因此本课题针对合作医院所提供的中医哮喘病病案数据采用集成学习模型进行分类研究,以获得中医哮喘病数据的辨证规律。首先对中医病案进行量化处理,并根据改进的特征选择算法IHCFS(Improved Hierarchical Clustering Feature Selection Algorithm)获取中医哮喘病的主症状。为了更加客观的描述中医病案症状,对病案症状信息进行分级量化,并采用数据库编程实现自动批量文本数字化处理以用于后续研究;对于中医病案数据特征存在繁多的症状和冗余信息等问题,主要对层次聚类特征选择算法的评价函数以及终止准则进行改进得到IHCFS算法,以更好的剔除冗余信息从而获取哮喘病的主症状。仿真实验证明所获取的主症状更有利于后续辩证分类。然后提出一种基于多模态扰动策略的集成学习算法ELSFS(Ensemble Learning Based on Sampling and Future Selection)用于中医病案的辩证分类。其中利用随机抽样法进行样本空间扰动,利用IHCFS算法进行特征空间扰动以获得差异性更大的基分类器。在UCI数据集上仿真验证,结果显示ELSFS算法具有更好的分类性能。最后考虑基分类器数目过多时所产生的冗余基分类器对模型预测性能的影响,提出一种基于加权贪心策略的选择性集成学习算法SELGS(Selective Ensemble Based on Weighted Greedy Strategy)以减少预测阶段的存储空间、降低运算开销,以提高加快预测速度。通过仿真证明SELGS算法具有更好的辩证分类性能。
【学位授予单位】:青岛科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP181;TP311.13

【参考文献】

相关期刊论文 前10条

1 潘主强;张林;张磊;李国正;颜仕星;;中医临床不均衡数据疾病分类方法研究[J];智能系统学报;2017年06期

2 毋雪雁;王水花;张煜东;;K最近邻算法理论与应用综述[J];计算机工程与应用;2017年21期

3 颜建军;胡宗杰;刘国萍;王忆勤;付晶晶;郭睿;钱鹏;;基于极值随机森林的慢性胃炎中医证候分类[J];华东理工大学学报(自然科学版);2017年05期

4 陈德华;吴迪;潘乔;;基于超声特征集成学习的甲状腺结节分类方法研究[J];智能计算机与应用;2016年06期

5 江峰;张友强;杜军威;刘国柱;冯云霞;;一种基于抽样与约简的集成学习算法[J];青岛科技大学学报(自然科学版);2016年04期

6 江峰;张友强;杜军威;刘国柱;眭跃飞;;基于近似约简的集成学习算法及其在入侵检测中的应用[J];北京工业大学学报;2016年06期

7 曹杰;邵笑笑;;基于信息增益和Bagging集成学习算法的个人信用评估模型研究[J];数学的实践与认识;2016年08期

8 李诒靖;郭海湘;李亚楠;刘晓;;一种基于Boosting的集成学习算法在不均衡数据中的分类[J];系统工程理论与实践;2016年01期

9 吴嘉瑞;唐仕欢;郭位先;张晓朦;张冰;;基于数据挖掘的名老中医经验传承研究述评[J];中国中药杂志;2014年04期

10 郑舞;刘国萍;;常见数据挖掘方法在中医诊断领域的应用概况[J];中国中医药信息杂志;2013年04期

相关博士学位论文 前2条

1 袁锋;中医医案文本挖掘的若干关键技术研究[D];山东师范大学;2016年

2 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年

相关硕士学位论文 前10条

1 朱灿杰;基于集成学习与规则提取的多标记学习方法在高血压证素辩证中的研究[D];深圳大学;2017年

2 陈亚楠;基于Hadoop的中医病案数据挖掘系统研究与设计[D];青岛科技大学;2017年

3 胡金涛;基于C4.5决策树的学生成绩预测教学系统的研究与实现[D];西南交通大学;2017年

4 邢盼盼;基于Bagging的两阶段特征选择集成分类器研究[D];郑州大学;2017年

5 王颖;特征选择辅助的基于集成学习的入侵检测模型研究[D];兰州大学;2017年

6 张硕;基于KNN算法的空间手势识别研究与应用[D];吉林大学;2017年

7 肖雨奇;多标签学习应用于中医诊断帕金森中类别不均衡问题研究[D];南京大学;2016年

8 毕凯;基于集成学习的药物相互作用信息抽取系统的研究与实现[D];西北农林科技大学;2016年

9 李怀;基于集成卷积神经网络的人脸年龄识别研究[D];华南理工大学;2016年

10 董国华;基于数据挖掘的中医诊断智能信息化技术研究[D];青岛科技大学;2015年



本文编号:2679992

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2679992.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户788bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com