基于监督学习分类算法的中医诊疗辨证分型方法研究
发布时间:2021-06-08 04:43
多标签分类问题是数据挖掘领域的一个重要分支,因其应用领域的广泛被人们熟知,也是大数据时代的研究热点。传统中医症状-证型的辨证论治思想在中医界并未达成共识,各家仍以经验为主,主观性较强。为了科学化处理医师的诊断经验,将诊疗数据训练成一个客观的诊断模型,将多标签分类技术应用于中医失眠辨证分型研究当中。希望该方法能够帮到临床医者,凸显其价值。中医病案本身具有异质性、多样性、冗余性等特点,为了客观公正的描述患者病情症状,有必要对病案症状信息进行分级量化处理,并按照多标签数据规格记录整理,以备训练算法模型。算法模型采用改进KNN算法的多标签分类模型,并将多标签算法进行分类讨论,详细阐述各个算法的原理和步骤,并比较各算法之间的优缺点,为了验证该算法的适用数据集范围,将该算法运用到不同数据集领域当中,以证明该算法的普适性、高效性。针对传统的KNN算法学习的是周围相似数据分布情况,而贝叶斯方法学习的是数据的全局分布情况这一问题,将KNN与贝叶斯方法相结合,即多标签K近邻算法(ML-KNN),这样既很好的继承了二者的优点,又能克服因样本数据不均衡带来的影响。然而ML-KNN算法并没有考虑到:在样本空间中...
【文章来源】:内蒙古科技大学内蒙古自治区
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
数据挖掘七大类
内蒙古科技大学硕士学位论文133基于数据挖掘的中医病案处理3.1数据挖掘数据挖掘(DataMining)是利用现代化专业技术对大规模数据集进行筛癣提取并抽象,建立算法模型,为我们所用。按照主要功能将数据挖掘分为以下七类:如图3.1;数据挖掘领域汇集了多个交叉学科,如图3.2;数据挖掘的一般步骤如图3.3。图3.1数据挖掘七大类图3.2数据挖掘领域图3.3数据挖掘一般步骤信息学科机器学习模式识别数据库技术AI神经网络信息检索数据可视化数理统计社会学科零售业临床医学金融业生物医学保险业预防医学电信业市场营销数据挖掘
内蒙古科技大学硕士学位论文15其中男性938例(38.97%),平均年龄(44.16±14.54)岁;女性1469例(61.03%),平均年龄(48.70±12.74)岁。经过统计,单证候病例1520例,占总病例的63.15%,兼证病例770例,占31.99%,其中三证合见病例117例,占4.86%,每个病例有24个属性。如下图3.4所示,自变量和因变量分别为,以及不同证型对应症状群如图3.5所示。图3.4失眠症的变量图3.5失眠症的五种证型由于中医病例特点,症状描述多掺杂医师主观感受,为了客观科学的描述症状表现,有必要将专业化的中医描述转化成数字语言。例如,二分类变量‘健忘’,有健忘现象数字化为1,没有健忘现象数字化为0,这里需要说明一点,将中医描述转化为数字语言,需把有序和无序变量都按无序处理。又如多分类变量‘便况’,将无明显症状量化为0,便秘状况量化为1,便溏状况量化为2等。如表3.1所示为不同症状对应量化值。表3.2样本数据统计证型肝火扰心证痰火扰心证心脾两虚证心肾不交证心胆气虚证总计数量9853016992331892407本次实验的训练数据集和测试数据集都采用该2407例病例数据。详细样本数据统计以及量化病例数据分别如下表3.2、表3.3所示。
【参考文献】:
期刊论文
[1]图像多标签学习的研究概述[J]. 袁梦奇,鲍秉坤. 南京信息工程大学学报(自然科学版). 2019(06)
[2]基于深度双向分类器链的多标签新闻分类算法[J]. 胡天磊,王皓波,尹文栋. 浙江大学学报(工学版). 2019(11)
[3]基于3种数据挖掘模型分析16618例含附子中成药的处方用药规律[J]. 陈俊麒,吴俊标,林华,胡黎,邓广海,赖潇潇,罗懿妮. 中国实验方剂学杂志. 2020(03)
[4]结合标签相关性和不均衡性的多标签学习模型[J]. 姜思羽,钟晓玲,邱少健,宋恒杰. 哈尔滨工业大学学报. 2019(01)
[5]基于迁移学习的多标签图像标注[J]. 秦莹华,李菲菲,陈虬. 电子科技. 2018(08)
[6]基于多标签学习的卷积神经网络的图像标注方法[J]. 高耀东,侯凌燕,杨大利. 计算机应用. 2017(01)
[7]国内中医住院病案首页质量分析与影响因素初探[J]. 谢佳东,赵玉凤,胡孔法,李国正,刘保延. 中国中医药信息杂志. 2016(12)
[8]一种多标签随机均衡采样算法[J]. 李思豪,陈福才,黄瑞阳. 计算机应用研究. 2017(10)
[9]失眠与抑郁关系2008-2013年研究进展及存在问题[J]. 张继辉,刘亚平,潘集阳. 中国心理卫生杂志. 2015(02)
[10]基于数据挖掘的名老中医经验传承研究述评[J]. 吴嘉瑞,唐仕欢,郭位先,张晓朦,张冰. 中国中药杂志. 2014(04)
博士论文
[1]基于本体数据库的多标签预测模型及生物医药数据挖掘研究[D]. 程翔.东华大学 2017
[2]基于数据库挖掘的经方治疗台湾人失眠与抑郁症的研究[D]. 陈懿琳.北京中医药大学 2016
[3]面向互联网应用的不平衡数据分类技术研究[D]. 李虎.国防科学技术大学 2016
[4]多医师辨证论治失眠有效治疗方药的发现研究[D]. 江丽杰.中国中医科学院 2014
[5]面向非均衡数据集的机器学习及在地学数据处理中的应用[D]. 谷琼.中国地质大学 2009
[6]文本分类技术与应用研究[D]. 郝秀兰.复旦大学 2008
[7]基于多标签学习的图像语义自动标注研究[D]. 王梅.复旦大学 2008
硕士论文
[1]基于集成学习的中医病案数据挖掘方法研究[D]. 张守宾.青岛科技大学 2018
[2]基于数据挖掘的张珍玉先生诊疗不寐证治规律研究[D]. 杨晗.山东中医药大学 2017
[3]553例阴虚不寐临床资料分析与证治规律探讨[D]. 于成.山东中医药大学 2017
[4]面向实体信息挖掘的多标签学习算法研究[D]. 李思豪.解放军信息工程大学 2017
[5]基于情感的多标签个性化音乐分类技术的研究与实现[D]. 谷炫志.浙江大学 2016
[6]基于数据挖掘的中医诊断智能信息化技术研究[D]. 董国华.青岛科技大学 2015
[7]多标签分类算法的研究及其在中医诊断帕金森领域的应用[D]. 方铭.南京大学 2015
[8]名老中医经验传承中的数据挖掘技术研究[D]. 肖光磊.南京理工大学 2008
本文编号:3217721
【文章来源】:内蒙古科技大学内蒙古自治区
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
数据挖掘七大类
内蒙古科技大学硕士学位论文133基于数据挖掘的中医病案处理3.1数据挖掘数据挖掘(DataMining)是利用现代化专业技术对大规模数据集进行筛癣提取并抽象,建立算法模型,为我们所用。按照主要功能将数据挖掘分为以下七类:如图3.1;数据挖掘领域汇集了多个交叉学科,如图3.2;数据挖掘的一般步骤如图3.3。图3.1数据挖掘七大类图3.2数据挖掘领域图3.3数据挖掘一般步骤信息学科机器学习模式识别数据库技术AI神经网络信息检索数据可视化数理统计社会学科零售业临床医学金融业生物医学保险业预防医学电信业市场营销数据挖掘
内蒙古科技大学硕士学位论文15其中男性938例(38.97%),平均年龄(44.16±14.54)岁;女性1469例(61.03%),平均年龄(48.70±12.74)岁。经过统计,单证候病例1520例,占总病例的63.15%,兼证病例770例,占31.99%,其中三证合见病例117例,占4.86%,每个病例有24个属性。如下图3.4所示,自变量和因变量分别为,以及不同证型对应症状群如图3.5所示。图3.4失眠症的变量图3.5失眠症的五种证型由于中医病例特点,症状描述多掺杂医师主观感受,为了客观科学的描述症状表现,有必要将专业化的中医描述转化成数字语言。例如,二分类变量‘健忘’,有健忘现象数字化为1,没有健忘现象数字化为0,这里需要说明一点,将中医描述转化为数字语言,需把有序和无序变量都按无序处理。又如多分类变量‘便况’,将无明显症状量化为0,便秘状况量化为1,便溏状况量化为2等。如表3.1所示为不同症状对应量化值。表3.2样本数据统计证型肝火扰心证痰火扰心证心脾两虚证心肾不交证心胆气虚证总计数量9853016992331892407本次实验的训练数据集和测试数据集都采用该2407例病例数据。详细样本数据统计以及量化病例数据分别如下表3.2、表3.3所示。
【参考文献】:
期刊论文
[1]图像多标签学习的研究概述[J]. 袁梦奇,鲍秉坤. 南京信息工程大学学报(自然科学版). 2019(06)
[2]基于深度双向分类器链的多标签新闻分类算法[J]. 胡天磊,王皓波,尹文栋. 浙江大学学报(工学版). 2019(11)
[3]基于3种数据挖掘模型分析16618例含附子中成药的处方用药规律[J]. 陈俊麒,吴俊标,林华,胡黎,邓广海,赖潇潇,罗懿妮. 中国实验方剂学杂志. 2020(03)
[4]结合标签相关性和不均衡性的多标签学习模型[J]. 姜思羽,钟晓玲,邱少健,宋恒杰. 哈尔滨工业大学学报. 2019(01)
[5]基于迁移学习的多标签图像标注[J]. 秦莹华,李菲菲,陈虬. 电子科技. 2018(08)
[6]基于多标签学习的卷积神经网络的图像标注方法[J]. 高耀东,侯凌燕,杨大利. 计算机应用. 2017(01)
[7]国内中医住院病案首页质量分析与影响因素初探[J]. 谢佳东,赵玉凤,胡孔法,李国正,刘保延. 中国中医药信息杂志. 2016(12)
[8]一种多标签随机均衡采样算法[J]. 李思豪,陈福才,黄瑞阳. 计算机应用研究. 2017(10)
[9]失眠与抑郁关系2008-2013年研究进展及存在问题[J]. 张继辉,刘亚平,潘集阳. 中国心理卫生杂志. 2015(02)
[10]基于数据挖掘的名老中医经验传承研究述评[J]. 吴嘉瑞,唐仕欢,郭位先,张晓朦,张冰. 中国中药杂志. 2014(04)
博士论文
[1]基于本体数据库的多标签预测模型及生物医药数据挖掘研究[D]. 程翔.东华大学 2017
[2]基于数据库挖掘的经方治疗台湾人失眠与抑郁症的研究[D]. 陈懿琳.北京中医药大学 2016
[3]面向互联网应用的不平衡数据分类技术研究[D]. 李虎.国防科学技术大学 2016
[4]多医师辨证论治失眠有效治疗方药的发现研究[D]. 江丽杰.中国中医科学院 2014
[5]面向非均衡数据集的机器学习及在地学数据处理中的应用[D]. 谷琼.中国地质大学 2009
[6]文本分类技术与应用研究[D]. 郝秀兰.复旦大学 2008
[7]基于多标签学习的图像语义自动标注研究[D]. 王梅.复旦大学 2008
硕士论文
[1]基于集成学习的中医病案数据挖掘方法研究[D]. 张守宾.青岛科技大学 2018
[2]基于数据挖掘的张珍玉先生诊疗不寐证治规律研究[D]. 杨晗.山东中医药大学 2017
[3]553例阴虚不寐临床资料分析与证治规律探讨[D]. 于成.山东中医药大学 2017
[4]面向实体信息挖掘的多标签学习算法研究[D]. 李思豪.解放军信息工程大学 2017
[5]基于情感的多标签个性化音乐分类技术的研究与实现[D]. 谷炫志.浙江大学 2016
[6]基于数据挖掘的中医诊断智能信息化技术研究[D]. 董国华.青岛科技大学 2015
[7]多标签分类算法的研究及其在中医诊断帕金森领域的应用[D]. 方铭.南京大学 2015
[8]名老中医经验传承中的数据挖掘技术研究[D]. 肖光磊.南京理工大学 2008
本文编号:3217721
本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/3217721.html
最近更新
教材专著