随机森林模型在数据核查中的应用研究
发布时间:2021-01-28 02:44
目的:数据核查是临床试验质量的保证,也是数据管理的核心部分。只有真实可靠、完整规范的数据才能保证临床试验结果的客观可信,试验药品的安全性才能得到保障。随着药物研发的日益增多和临床试验内容复杂性的增加,传统纸质问卷已经不能满足临床试验不断发展的需要,电子数据采集(EDC)系统成为临床试验中常用的数据录入工具。EDC系统中嵌入的核查功能能够对缺失值,异常值,逻辑错误等数据问题进行核对并改正。通过EDC系统的核查功能,最大限度的减少了错误数据和缺失数据。临床试验过程中安全性评价是临床试验能够顺利进行的首要条件,而不良事件是临床试验质量控制的重点,也是临床研究评价药物安全性的重要数据。临床试验研究中不良事件的核查一般通过人工核查实现,如出现不良事件而接受医疗处理的受试者,就需要在合并用药中寻找医疗处理记录,并比较不良事件与合并用药记录的一致性及时间的合理性。这种做法需要专业的医学人员或有经验的临床监查员(CRA)去完成,耗费人力及时间,且容易产生人为错误。因此本研究的目的是通过机器学习的方法,学习不良事件数据及合并用药数据之间的映射关系,并将这种关系嵌入EDC系统中。方法:本研究通过随机森林的...
【文章来源】:南京医科大学江苏省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
单颗决策树流程图
2.1.3 变量重要性评分随机森林能够计算单个变量的重要性,可用于筛选变量及降维。随机森林的重要性评分算法是基于 Gini 指数及置换法。Gini 指数法是在每棵树中计算父节点及下分的左右子节点的 Gini 指数,三者的差值即为此父节点变量的 Gini 指数,综合整个森林中该变量的 Gini 指数,其平均值即为改变量的重要性评分值,公式如下 :表示变量 在节点 m 中的重要性评分, 和 分别表示节点 m分割后左右新节点的 Gini 指数。图 2 随机森林建树示意图
高血压及其前30位合并用药备注:0表示与不良事件无关合并用药,1表示与不良事件有关合并用药,下同
【参考文献】:
期刊论文
[1]解读美国FDA关于临床研究监查的新指导原则[J]. 李宾. 中国处方药. 2013(05)
[2]运用随机森林分析药品不良反应发生的影响因素[J]. 钱维,王超,吴骋,许金芳,叶小飞,杜文民,贺佳. 中国卫生统计. 2013(02)
[3]基于随机森林方法的异常样本检测方法[J]. 邱一卉,林成德. 福建工程学院学报. 2007(04)
硕士论文
[1]基于随机森林两阶段逐步变量选择算法的研究及应用[D]. 冯盼峰.福建农林大学 2016
本文编号:3004213
【文章来源】:南京医科大学江苏省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
单颗决策树流程图
2.1.3 变量重要性评分随机森林能够计算单个变量的重要性,可用于筛选变量及降维。随机森林的重要性评分算法是基于 Gini 指数及置换法。Gini 指数法是在每棵树中计算父节点及下分的左右子节点的 Gini 指数,三者的差值即为此父节点变量的 Gini 指数,综合整个森林中该变量的 Gini 指数,其平均值即为改变量的重要性评分值,公式如下 :表示变量 在节点 m 中的重要性评分, 和 分别表示节点 m分割后左右新节点的 Gini 指数。图 2 随机森林建树示意图
高血压及其前30位合并用药备注:0表示与不良事件无关合并用药,1表示与不良事件有关合并用药,下同
【参考文献】:
期刊论文
[1]解读美国FDA关于临床研究监查的新指导原则[J]. 李宾. 中国处方药. 2013(05)
[2]运用随机森林分析药品不良反应发生的影响因素[J]. 钱维,王超,吴骋,许金芳,叶小飞,杜文民,贺佳. 中国卫生统计. 2013(02)
[3]基于随机森林方法的异常样本检测方法[J]. 邱一卉,林成德. 福建工程学院学报. 2007(04)
硕士论文
[1]基于随机森林两阶段逐步变量选择算法的研究及应用[D]. 冯盼峰.福建农林大学 2016
本文编号:3004213
本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/3004213.html
最近更新
教材专著