基于集成学习的乳腺癌分类研究
发布时间:2021-03-31 04:21
目的由于传统机器学习算法的分类能力较低,不足以辅助临床诊断,本研究将分类功能强大的集成学习与医疗诊断相结合,提高诊断准确率和召回率。方法研究应用集成学习的随机森林算法和Xgboost算法来提高模型准确率和召回率,并利用交叉验证和网格搜索提高模型拟合能力。结果通过对比随机森林模型、Xgboost模型和传统机器学习的决策树模型,研究得出,集成学习极大地提高了乳腺癌诊断的准确率和召回率,准确率从0.92提高至0.96,召回率从0.90提高至0.97和0.99。结论将集成学习算法与实际医疗诊断技术相结合具有实际的研究意义,可以进一步将两种领域相结合,以提高医疗诊断的效率和准确率。
【文章来源】:中国医疗设备. 2020,35(12)
【文章页数】:4 页
【部分图文】:
决策树结构
随机森林是1995年由贝尔实验室的Tin Kam Ho提出的[12],该模型是根据多个决策树分类器的输出,采用投票取众数的方法进行决策[13,14],其模型结构如图2所示,第一层是弱分类器,每个弱分类器都根据数据做出自己的判断,最后采取投票选择投票最多的结果作为真实输出结果。此项目模型利用了10折交叉验证和网格搜索等方法优化模型,提高模型泛化能力和准确度。n折交叉验证就是在训练模型时将训练样本分成n份,其中的1份保留作为验证模型的数据,其余的n-1个样本用来训练,交叉验证重复n次,最终每个子样本都验证一次,然后将n次的结果平均得到一个单一的估测值,可以防止模型过拟合,提高模型的泛化能力。
Xgboost结构
【参考文献】:
期刊论文
[1]集成学习在糖尿病预测中的应用[J]. 张玉玺,贺松,尤思梦. 智能计算机与应用. 2019(05)
[2]改进随机森林算法综述[J]. 孙明喆,毕瑶家,孙驰. 现代信息科技. 2019(20)
[3]基于XGBoost算法的风机叶片结冰状态评测[J]. 李大中,王超,李颖宇. 电力科学与工程. 2019(09)
[4]基于主动集成学习的中医智能诊断模型及构建方法[J]. 任雪,郭艳. 中国循证医学杂志. 2019(09)
[5]基于卷积神经网络和集成学习的阿尔茨海默症早期诊断[J]. 曾安,贾龙飞,潘丹,Song Xiaowei. 生物医学工程学杂志. 2019(05)
[6]随机森林算法研究综述[J]. 吕红燕,冯倩. 河北省科学院学报. 2019(03)
[7]基于XGBoost的特征选择算法[J]. 李占山,刘兆赓. 通信学报. 2019(10)
[8]集成学习方法研究[J]. 周钢,郭福亮. 计算技术与自动化. 2018(04)
[9]集成学习方法:研究综述[J]. 徐继伟,杨云. 云南大学学报(自然科学版). 2018(06)
博士论文
[1]基于集成学习的工业过程监测[D]. 刘玥.浙江大学 2019
本文编号:3110780
【文章来源】:中国医疗设备. 2020,35(12)
【文章页数】:4 页
【部分图文】:
决策树结构
随机森林是1995年由贝尔实验室的Tin Kam Ho提出的[12],该模型是根据多个决策树分类器的输出,采用投票取众数的方法进行决策[13,14],其模型结构如图2所示,第一层是弱分类器,每个弱分类器都根据数据做出自己的判断,最后采取投票选择投票最多的结果作为真实输出结果。此项目模型利用了10折交叉验证和网格搜索等方法优化模型,提高模型泛化能力和准确度。n折交叉验证就是在训练模型时将训练样本分成n份,其中的1份保留作为验证模型的数据,其余的n-1个样本用来训练,交叉验证重复n次,最终每个子样本都验证一次,然后将n次的结果平均得到一个单一的估测值,可以防止模型过拟合,提高模型的泛化能力。
Xgboost结构
【参考文献】:
期刊论文
[1]集成学习在糖尿病预测中的应用[J]. 张玉玺,贺松,尤思梦. 智能计算机与应用. 2019(05)
[2]改进随机森林算法综述[J]. 孙明喆,毕瑶家,孙驰. 现代信息科技. 2019(20)
[3]基于XGBoost算法的风机叶片结冰状态评测[J]. 李大中,王超,李颖宇. 电力科学与工程. 2019(09)
[4]基于主动集成学习的中医智能诊断模型及构建方法[J]. 任雪,郭艳. 中国循证医学杂志. 2019(09)
[5]基于卷积神经网络和集成学习的阿尔茨海默症早期诊断[J]. 曾安,贾龙飞,潘丹,Song Xiaowei. 生物医学工程学杂志. 2019(05)
[6]随机森林算法研究综述[J]. 吕红燕,冯倩. 河北省科学院学报. 2019(03)
[7]基于XGBoost的特征选择算法[J]. 李占山,刘兆赓. 通信学报. 2019(10)
[8]集成学习方法研究[J]. 周钢,郭福亮. 计算技术与自动化. 2018(04)
[9]集成学习方法:研究综述[J]. 徐继伟,杨云. 云南大学学报(自然科学版). 2018(06)
博士论文
[1]基于集成学习的工业过程监测[D]. 刘玥.浙江大学 2019
本文编号:3110780
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3110780.html