基于血常规指标的高危人群血液系统恶性肿瘤筛查模型研究
发布时间:2022-10-30 13:36
背景:血液系统恶性肿瘤(Hematological Malignances,HM)是一类严重影响人群健康的恶性肿瘤。早期诊断HM,无论是对提高患者生存率,还是对节约医疗费用,均至关重要。构建早期、廉价、无创、灵敏、特异、高效的HM筛查模型,从而及早筛查高危个体,是达到这一目标的前提。然而,目前已有的HM筛查模型,均采用基于医院场景的病例对照研究设计。此种设计类型,往往采用1:1或1:2等阳性样本与阴性样本的比例。此种情况下,样本中的患病率为50%或33%等,远远高于真实世界社区人群中的HM患病率。基于上述病例对照设计所构建的HM筛查模型,即使灵敏度、特异度均达到很高的水平,当其运用于真实目标人群时,阳性预测值也会很低,因而其实际应用价值大打折扣。研究目标及方法:基于“山东全人群全生命周期健康医疗大数据队列”和“山东多中心健康管理队列”,构建符合人群HM年龄、性别患病率分布实际情况的建模数据集;进而,采用血常规检测指标,通过对比XGBoost、LightGBM、随机森林三种集成学习算法,筛选适于真实世界目标高危人群的最优HM筛查模型,并开发HM筛查辅助APP在线工具。为基层医疗机构或社区...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
符号说明
1 前言
2 资料与方法
2.1 资料来源
2.2 研究对象
2.3 疾病定义与筛查指标
2.4 建模策略
2.5 建模方法
2.5.1 随机森林算法
2.5.2 基于GBDT改进算法的LightGBM
2.5.3 基于GBDT改进算法的XGBoost
2.6 HM辅助筛查APP在线工具的开发
2.7 统计分析方法
3 结果
3.1 随机抽样人群中血液系统恶性肿瘤(HM)分布特征分析
3.1.1 样本人群的人口构成
3.1.2 随机抽样的队列(1)中18岁以上人群HM患病率及其分布特征
3.1.3 随机抽样的队列(1)中50岁以上人群就医行为分析
3.2 HM筛查模型模拟建模样本的构建及其特征分析
3.3 HM筛查模型的构建及其评价
3.3.1 基于随机森林算法的HM筛查模型
3.3.2 基于LightGBM算法的HM筛查模型
3.3.3 基于XGBoost算法的HM筛查模型
3.3.4 三种HM筛查模型的效果比较
3.3.5 HM最优筛查模型的选择
3.4 HM辅助筛查APP在线工具的研发
4 讨论
4.1 人群中HM患病水平及患者就医行为
4.2 HM筛查模型建模策略
4.3 HM最优筛查模型的确定
4.4 HM辅助筛查APP在线工具
5 结论
创新与不足
附录
参考文献
致谢
攻读学位期间发表的学术论文目录
学位论文评阅及答辩情况表
【参考文献】:
期刊论文
[1]随机森林理论浅析[J]. 董师师,黄哲学. 集成技术. 2013(01)
[2]随机森林方法研究综述[J]. 方匡南,吴见彬,朱建平,谢邦昌. 统计与信息论坛. 2011(03)
[3]集成学习:Boosting算法综述[J]. 于玲,吴铁军. 模式识别与人工智能. 2004(01)
硕士论文
[1]基于机器学习的网络流量预测与应用研究[D]. 师圣蔓.北京邮电大学 2019
[2]基于LightGBM的居民出行方式选择模型及应用研究[D]. 范德祥.华中科技大学 2018
[3]急性髓系白血病发病因素及慢性髓性白血病TKIs早期疗效评估的探讨[D]. 王英俏.山东大学 2016
[4]基于集成学习算法的异常检测研究[D]. 陈飞宇.南京大学 2015
[5]基于集成学习和深度学习的应用研究[D]. 王双玲.山东大学 2014
本文编号:3698984
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
中文摘要
Abstract
符号说明
1 前言
2 资料与方法
2.1 资料来源
2.2 研究对象
2.3 疾病定义与筛查指标
2.4 建模策略
2.5 建模方法
2.5.1 随机森林算法
2.5.2 基于GBDT改进算法的LightGBM
2.5.3 基于GBDT改进算法的XGBoost
2.6 HM辅助筛查APP在线工具的开发
2.7 统计分析方法
3 结果
3.1 随机抽样人群中血液系统恶性肿瘤(HM)分布特征分析
3.1.1 样本人群的人口构成
3.1.2 随机抽样的队列(1)中18岁以上人群HM患病率及其分布特征
3.1.3 随机抽样的队列(1)中50岁以上人群就医行为分析
3.2 HM筛查模型模拟建模样本的构建及其特征分析
3.3 HM筛查模型的构建及其评价
3.3.1 基于随机森林算法的HM筛查模型
3.3.2 基于LightGBM算法的HM筛查模型
3.3.3 基于XGBoost算法的HM筛查模型
3.3.4 三种HM筛查模型的效果比较
3.3.5 HM最优筛查模型的选择
3.4 HM辅助筛查APP在线工具的研发
4 讨论
4.1 人群中HM患病水平及患者就医行为
4.2 HM筛查模型建模策略
4.3 HM最优筛查模型的确定
4.4 HM辅助筛查APP在线工具
5 结论
创新与不足
附录
参考文献
致谢
攻读学位期间发表的学术论文目录
学位论文评阅及答辩情况表
【参考文献】:
期刊论文
[1]随机森林理论浅析[J]. 董师师,黄哲学. 集成技术. 2013(01)
[2]随机森林方法研究综述[J]. 方匡南,吴见彬,朱建平,谢邦昌. 统计与信息论坛. 2011(03)
[3]集成学习:Boosting算法综述[J]. 于玲,吴铁军. 模式识别与人工智能. 2004(01)
硕士论文
[1]基于机器学习的网络流量预测与应用研究[D]. 师圣蔓.北京邮电大学 2019
[2]基于LightGBM的居民出行方式选择模型及应用研究[D]. 范德祥.华中科技大学 2018
[3]急性髓系白血病发病因素及慢性髓性白血病TKIs早期疗效评估的探讨[D]. 王英俏.山东大学 2016
[4]基于集成学习算法的异常检测研究[D]. 陈飞宇.南京大学 2015
[5]基于集成学习和深度学习的应用研究[D]. 王双玲.山东大学 2014
本文编号:3698984
本文链接:https://www.wllwen.com/yixuelunwen/zlx/3698984.html
最近更新
教材专著