【摘要】:研究目的在糖尿病肾病的计算机辅助辨证研究背景下,基于复杂网络理论解决以下建模工作中存在的实际问题:1.提出并分析糖尿病肾病数据的多标签属性特点,探索糖尿病肾病多标签数据的处理方法,解决以往单纯采用单标签学习所导致的证型分类结果偏离实际的问题。2.建立适合糖尿病肾病的多标签数据特征选择方法,解决建模过程中数据维度高而稀疏、缺乏典型特征组合对模型性能造成严重影响的问题。3.建立糖尿病肾病的多标签辨证模型,完善糖尿病肾病的多证型及兼夹证型的诊断问题。研究方法1.针对糖尿病肾病数据的多标签属性,在广泛文献调研的基础上,利用复杂网络理论构建糖尿病肾病辨证网(DNBZN),对糖尿病肾病多标签数据进行合理、有效的表征。2.针对中医药数据维度高而稀疏的特点,首先提出一种新的特征选择方法对糖尿病肾病数据进行预处理。该特征选择方法建立在复杂网络广义社会合作网的理论基础上,利用重叠社区发现Bitector算法对网络进行重叠社区发现,进而选择出对证型分类代表性强且区分度高的典型特征组合。然后在网络社区发现结果的研究基础上,建立糖尿病肾病多标签特征数据集,并将数据集结构化处理,为下一步多标签分类模型研究提供数据基础。3.针对糖尿病肾病的多证型分类问题,探索和使用多种建模策略,利用SVM、 AdaBoost、ANN和KNN最近邻等多种机器学习方法进行建模,并尝试使用多种不同的基础分类器组合形成不同的多标签分类器,依据训练结果学习和调整模型参数,寻找适合糖尿病肾病的多证型辨证模型。4.针对辨证模型的分类性能评估问题,调用Hamming Loss、Ranking Loss、One-error、 Coverage、Average Precision等5种公认的多标签学习评价指标对每种多标签辨证模型的性能进行综合评价。研究结果1.经过文献调研,共收集来自256篇文献中的113个症状(特征)和15个证型(标签),每个症状至少属于1个证型,至多属于6个证型。建立的DNBZN具有113个症状节点和15个证型节点,边代表症状节点对相应证型节点的特异度,边权由基尼指数量化表示。使用二分网络Bitector算法对DNBZN进行重叠社区发现后,发现了肝肾阴虚、气阴两虚的重叠社区和脾肾气虚、脾肾阳虚、阴阳两虚重叠社区,以及其余10个非重叠社区。每个社区内部的节点是对该证型标签区分度高及代表性强的特征组合,其余未进入该社区的节点被视为该证型的冗余或不相关特征删除,有效降低了特征维数。结合中医理论对特征选择结果进行验证,结果表明基于重叠社区发现的特征选择方法选择出的症状特征合理有效,符合中医理论和临床实际。2.依据文献调研和网络构建结果,建立了一个拥有113个特征和15个类别标签的糖尿病肾病多标签特征数据集。在数据集中构建特征及特征组合与证型标签之间的映射关系。单个症状与其所归属的证型标签之间的映射关系为189条,在此基础上结合社区发现结果,扩展特征组合与证型标签之间的映射关系。最后建立的特征数据集中共拥有1759条映射关系,作为后续多标签辨证建模工作的数据来源。3.在“转化问题”和“算法适应”两种多标签学习的建模策略下完成建模工作。在“转化问题”策略下使用SVM和AdaBoost建立多个二分类基础分类器对糖尿病肾病特征数据集进行多标签分类建模;并分别选择线性核函数、二次方程核函数、多项式核函数、径向基核函数和多层感知核函数等5种核函数作为支持向量机的核函数进行建模,评估模型的分类效果,发现模型对每个证型二分类准确率达到97%以上;分别使用Real AdaBoost, Gentle AdaBoost和Modest AdaBoost算法作为AdaBoost的基础二分类分类器进行多标签建模,发现模型对每个证型的二分类准确率接近98%。在“算法适应”策略下,使用ANN和KNN直接在特征数据集上进行多标签分类,优化参数后,ANN模型整体分类准确率达到96.2%;KNN模型整体分类准确率达到94.67%。4.使用10折交叉验证方法,计算Hamming Loss、Ranking Loss、One-error、Coverage、 Average Precision等5个指标的平均值,对SVM、Adaboost、ANN和KNN模型的性能进行综合比较,结果表明这四种模型都达到了令人满意的分类精度,具有良好的性能。相比较之下SVM的综合性能最佳,其次是AdaBoost和ANN,KNN的综合性能相对较弱。研究结论1.多标签学习更符合中医临床实际,多标签数据处理方法和多标签机器学习策略可以提高糖尿病肾病计算机辅助辨证的准确性、完善多证型及兼夹证型的诊断,进一步为临床遣方用药提供参考。2.本文提出的基于复杂网络重叠社区发现算法的特征选择能有效提取出对证型代表性强且区分度高的典型特征组合,显著提高分类器的分类性能,是糖尿病肾病数据特征选择的一种新的有效方法。3.本文使用的多种建模策略能够胜任糖尿病肾病多证型分类任务,分类性能令人满意;同时模型也适用于中医药领域具有高维度、稀疏性和非线性特点的其他数据和类似问题的建模研究。
[Abstract]:......
【学位授予单位】:北京中医药大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:R259
【相似文献】
相关期刊论文 前5条
1 裴晓梅;郑崇勋;;基于Adaboost技术的大脑运动意识任务分类[J];北京生物医学工程;2008年05期
2 田银;李沛洋;徐鹏;;基于AdaBoost的脑机接口分类算法研究[J];电子科技大学学报;2013年05期
3 柳秋云;;改进的朴素贝叶斯分类器在医疗诊断中的应用[J];科技创新导报;2008年31期
4 綦宏志;许敏鹏;明东;万柏坤;刘志朋;殷涛;;P300 Speller中基于AdaBoost SVM的导联筛选研究[J];仪器仪表学报;2012年05期
5 ;[J];;年期
相关会议论文 前10条
1 Wen Feng;;A Novel Lips Detection Method Combined Adaboost Algorithm and Camshift Algorithm[A];2012年计算机应用与系统建模国际会议论文集[C];2012年
2 张超;苗振江;;基于AdaBoost的面部信息感知[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
3 郭翌;汪源源;;基于Adaboost算法的颈动脉粥样硬化判别方法[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年
4 张红梅;高海华;王行愚;;抑制样本噪声的AdaBoost算法及其在入侵检测中的应用[A];2007年中国智能自动化会议论文集[C];2007年
5 陆文聪;钮冰;金雨欢;;基于AdaBoost算法的亚细胞位置预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
6 陈宏伟;刘建伟;费向东;;一种半监督环境下的Adaboost算法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
7 唐晓丹;苗振江;;基于AdaBoost和粒子滤波的目标跟踪[A];第十四届全国图象图形学学术会议论文集[C];2008年
8 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
9 ;Using Skin Color and HAD-AdaBoost Algorithm for Face Detection in Color Images[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年
10 肖磊;李丽;肖佳文;;基于AdaBoost-SVM的上市公司信用风险评估[A];2012管理创新、智能科技与经济发展研讨会论文集[C];2012年
相关博士学位论文 前4条
1 佟旭;基于复杂网络理论的糖尿病肾病辨证建模研究[D];北京中医药大学;2016年
2 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年
3 张太宁;人眼注视点估计方法的研究[D];南开大学;2013年
4 赵培英;基于智能计算的膜蛋白结构与相互作用预测研究[D];东华大学;2010年
相关硕士学位论文 前10条
1 宋雨;基于视觉图片的脑—机接口控制研究[D];天津理工大学;2015年
2 林欣;基于改进肤色模型的AdaBoost人脸检测算法研究[D];陕西科技大学;2015年
3 袁浩杰;Adaboost算法的并行化及其在目标分类中的应用[D];华南理工大学;2015年
4 张恒;基于近红外图像的疲劳驾驶检测研究与系统实现[D];长安大学;2015年
5 朱弘扬;多规则Adaboost算法及其应用研究[D];大连海事大学;2016年
6 梁振华;基于Adaboost与光流法的嘴唇动作获取系统的实现[D];南京大学;2014年
7 韦洪喜;司机防疲劳驾驶系统研究[D];安徽理工大学;2016年
8 龙伶敏;基于Adaboost的人脸检测方法及眼睛定位算法研究[D];电子科技大学;2008年
9 刘艺;基于改进Adaboost算法的目标检测和追踪技术[D];重庆大学;2008年
10 陈晓宾;基于肤色和AdaBoost算法的人脸检测方法研究[D];大连理工大学;2009年
,
本文编号:
2357019
本文链接:https://www.wllwen.com/zhongyixuelunwen/2357019.html