关联分类算法研究及其在冠心病诊断中的应用
发布时间:2022-01-08 13:11
随着社会经济的发展与物质条件的不断充裕,国民生活方式愈发趋于不健康化。在社会老龄化与城市化不断加速的背景下,以冠心病为代表的心血管疾病近年来在中国的流行趋势明显,已成为居民死亡的首要原因。另一方面,信息技术和物理存储技术的不断发展,也使得医疗诊断的手段越发多样、过程越发复杂,由此积累了海量的医疗数据。如何有效地利用这些数据,发现其中有价值的信息,为疾病的预防与诊断提供参考,具有重要的研究意义。本文的具体研究成果如下:针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分块挖掘和事先剪枝的关联分类算法改进方案ACCP。根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪过程进行了改进与优化。基于UCI数据集的实验结果表明,此算法改进方案相比传统CBA关联分类算法和C4.5决策树算法有着更好的分类性能,平均分类准确率分别提高了3.93和5.4个百分点,平均灵敏度分别提高了3.95和4.51个百分点,且在算法运行时间上明显优于传统CBA算法,取得了较好的应用效果。针对传统Relief系列算法无法过滤冗余特征的问题,提出了一种基于Relief...
【文章来源】:浙江理工大学浙江省
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 数据挖掘的研究现状
1.2.2 关联分类算法的研究现状
1.2.3 特征约简技术的研究现状
1.2.4 数据挖掘在冠心病诊疗中的应用研究
1.3 主要研究内容和创新点
1.4 论文组织结构安排
第二章 关联分类及特征约简相关理论基础
2.1 关联分类算法论述
2.1.1 关联分类的基本概念和定义
2.1.2 分类关联规则生成
2.1.3 分类规则修剪
2.2 数据挖掘中的特征选择
2.2.1 特征选择相关理论
2.2.2 特征子集的生成
2.2.3 特征子集的评估
2.3 模型评测指标
2.4 本章小结
第三章 基于分块挖掘和事先剪枝的关联分类算法研究
3.1 引言
3.2 关联分类算法改进思想
3.2.1 基于分类标识的规则挖掘
3.2.2 基于最大频繁项集的事先剪枝
3.2.3 分类规则修剪
3.3 算法实现与实例分析
3.4 实验结果验证
3.4.1 实验环境与数据准备
3.4.2 实验结果分析
3.5 本章小结
第四章 基于Relief F算法和互信息的特征选择算法研究
4.1 引言
4.2 基于Relief F算法的特征权重计算
4.3 基于互信息的特征子集生成和修正
4.3.1 基于类别属性互信息的特征子集生成
4.3.2 基于特征间互信息的特征子集修正
4.4 实验结果验证
4.4.1 实验数据准备与说明
4.4.2 实验过程与结果分析
4.5 本章小结
第五章 改进后的关联分类算法在冠心病诊断中的应用
5.1 引言
5.2 实验环境介绍
5.3 实验数据采集与处理
5.4 基于ACCP关联分类算法的冠心病诊断
5.5 本章小结
第六章 总结与展望
6.1 全文工作总结
6.2 未来的工作展望
参考文献
攻读学位期间的研究成果
致谢
【参考文献】:
期刊论文
[1]《中国心血管病预防指南(2017)》冠心病二级预防要点[J]. 实用心脑肺血管病杂志. 2018(01)
[2]《中国心血管病报告2017》概要[J]. 陈伟伟,高润霖,刘力生,朱曼璐,王文,王拥军,吴兆苏,李惠君,顾东风,杨跃进,郑哲,蒋立新,胡盛寿. 中国循环杂志. 2018(01)
[3]广州市番禺区农民急性冠心病事件发病率及20年变化趋势[J]. 邓木兰,李河,石美玲,何永全,廖剑勇,杨捷,江夏杏,郭成业,麦劲壮,刘小清. 中华心血管病杂志. 2014 (03)
[4]数据挖掘中数据预处理关键技术研究[J]. 解二虎. 科技通报. 2013(12)
[5]BP神经网络模型优化研究[J]. 张琛. 吉林省教育学院学报. 2011(07)
[6]CBA分类算法的一种改进[J]. 禹蒲阳. 计算机应用与软件. 2010(08)
[7]数据挖掘分类算法在冠心病临床应用的比较[J]. 陈建新,西广成,王伟,赵慧辉,陈静. 北京生物医学工程. 2008(03)
[8]特征选择算法研究综述[J]. 毛勇,周晓波,夏铮,尹征,孙优贤. 模式识别与人工智能. 2007(02)
[9]改进的差别矩阵及其求核方法[J]. 杨明,孙志挥. 复旦学报(自然科学版). 2004(05)
[10]基于条件信息熵的决策表约简[J]. 王国胤,于洪,杨大春. 计算机学报. 2002(07)
博士论文
[1]面向高维小样本数据的分类特征选择算法研究[D]. 张靖.合肥工业大学 2014
[2]机器学习中特征选问题研究[D]. 孙鑫.吉林大学 2013
[3]基于信息熵的特征选择算法研究[D]. 刘华文.吉林大学 2010
[4]文本分类中特征选择技术的研究[D]. 王博.国防科学技术大学 2009
[5]关联规则挖掘方法的研究及应用[D]. 刘亚波.吉林大学 2005
硕士论文
[1]关联分类算法及其在医疗数据中的应用研究[D]. 郭叔瑾.兰州交通大学 2018
[2]基于条件信息熵的超高维分类数据特征筛选[D]. 孙超男.南京信息工程大学 2017
[3]关联分类算法研究及其在海量慢病医疗数据挖掘中的应用[D]. 柴艺.北京邮电大学 2016
[4]基于数据挖掘的健康管理系统[D]. 崔志敏.河北科技大学 2015
[5]基于冠心病电子病历的数据挖掘研究[D]. 李准.重庆医科大学 2013
[6]基于关联规则挖掘的分类算法研究[D]. 许立莎.西安科技大学 2012
[7]基于粗糙集理论属性约简的分类算法研究[D]. 杜艳辉.大连理工大学 2012
[8]关联分析在冠心病诊疗数据中的应用研究[D]. 金轶.中南大学 2008
[9]特征选择算法研究[D]. 苏映雪.国防科学技术大学 2006
[10]基于关联规则的挖掘理论研究及应用[D]. 熊瑾.南昌大学 2006
本文编号:3576619
【文章来源】:浙江理工大学浙江省
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 数据挖掘的研究现状
1.2.2 关联分类算法的研究现状
1.2.3 特征约简技术的研究现状
1.2.4 数据挖掘在冠心病诊疗中的应用研究
1.3 主要研究内容和创新点
1.4 论文组织结构安排
第二章 关联分类及特征约简相关理论基础
2.1 关联分类算法论述
2.1.1 关联分类的基本概念和定义
2.1.2 分类关联规则生成
2.1.3 分类规则修剪
2.2 数据挖掘中的特征选择
2.2.1 特征选择相关理论
2.2.2 特征子集的生成
2.2.3 特征子集的评估
2.3 模型评测指标
2.4 本章小结
第三章 基于分块挖掘和事先剪枝的关联分类算法研究
3.1 引言
3.2 关联分类算法改进思想
3.2.1 基于分类标识的规则挖掘
3.2.2 基于最大频繁项集的事先剪枝
3.2.3 分类规则修剪
3.3 算法实现与实例分析
3.4 实验结果验证
3.4.1 实验环境与数据准备
3.4.2 实验结果分析
3.5 本章小结
第四章 基于Relief F算法和互信息的特征选择算法研究
4.1 引言
4.2 基于Relief F算法的特征权重计算
4.3 基于互信息的特征子集生成和修正
4.3.1 基于类别属性互信息的特征子集生成
4.3.2 基于特征间互信息的特征子集修正
4.4 实验结果验证
4.4.1 实验数据准备与说明
4.4.2 实验过程与结果分析
4.5 本章小结
第五章 改进后的关联分类算法在冠心病诊断中的应用
5.1 引言
5.2 实验环境介绍
5.3 实验数据采集与处理
5.4 基于ACCP关联分类算法的冠心病诊断
5.5 本章小结
第六章 总结与展望
6.1 全文工作总结
6.2 未来的工作展望
参考文献
攻读学位期间的研究成果
致谢
【参考文献】:
期刊论文
[1]《中国心血管病预防指南(2017)》冠心病二级预防要点[J]. 实用心脑肺血管病杂志. 2018(01)
[2]《中国心血管病报告2017》概要[J]. 陈伟伟,高润霖,刘力生,朱曼璐,王文,王拥军,吴兆苏,李惠君,顾东风,杨跃进,郑哲,蒋立新,胡盛寿. 中国循环杂志. 2018(01)
[3]广州市番禺区农民急性冠心病事件发病率及20年变化趋势[J]. 邓木兰,李河,石美玲,何永全,廖剑勇,杨捷,江夏杏,郭成业,麦劲壮,刘小清. 中华心血管病杂志. 2014 (03)
[4]数据挖掘中数据预处理关键技术研究[J]. 解二虎. 科技通报. 2013(12)
[5]BP神经网络模型优化研究[J]. 张琛. 吉林省教育学院学报. 2011(07)
[6]CBA分类算法的一种改进[J]. 禹蒲阳. 计算机应用与软件. 2010(08)
[7]数据挖掘分类算法在冠心病临床应用的比较[J]. 陈建新,西广成,王伟,赵慧辉,陈静. 北京生物医学工程. 2008(03)
[8]特征选择算法研究综述[J]. 毛勇,周晓波,夏铮,尹征,孙优贤. 模式识别与人工智能. 2007(02)
[9]改进的差别矩阵及其求核方法[J]. 杨明,孙志挥. 复旦学报(自然科学版). 2004(05)
[10]基于条件信息熵的决策表约简[J]. 王国胤,于洪,杨大春. 计算机学报. 2002(07)
博士论文
[1]面向高维小样本数据的分类特征选择算法研究[D]. 张靖.合肥工业大学 2014
[2]机器学习中特征选问题研究[D]. 孙鑫.吉林大学 2013
[3]基于信息熵的特征选择算法研究[D]. 刘华文.吉林大学 2010
[4]文本分类中特征选择技术的研究[D]. 王博.国防科学技术大学 2009
[5]关联规则挖掘方法的研究及应用[D]. 刘亚波.吉林大学 2005
硕士论文
[1]关联分类算法及其在医疗数据中的应用研究[D]. 郭叔瑾.兰州交通大学 2018
[2]基于条件信息熵的超高维分类数据特征筛选[D]. 孙超男.南京信息工程大学 2017
[3]关联分类算法研究及其在海量慢病医疗数据挖掘中的应用[D]. 柴艺.北京邮电大学 2016
[4]基于数据挖掘的健康管理系统[D]. 崔志敏.河北科技大学 2015
[5]基于冠心病电子病历的数据挖掘研究[D]. 李准.重庆医科大学 2013
[6]基于关联规则挖掘的分类算法研究[D]. 许立莎.西安科技大学 2012
[7]基于粗糙集理论属性约简的分类算法研究[D]. 杜艳辉.大连理工大学 2012
[8]关联分析在冠心病诊疗数据中的应用研究[D]. 金轶.中南大学 2008
[9]特征选择算法研究[D]. 苏映雪.国防科学技术大学 2006
[10]基于关联规则的挖掘理论研究及应用[D]. 熊瑾.南昌大学 2006
本文编号:3576619
本文链接:https://www.wllwen.com/yixuelunwen/xxg/3576619.html
最近更新
教材专著