当前位置:主页 > 医学论文 > 医卫管理论文 >

线性回归和logistic回归模型样本量计算的图示化探索研究

发布时间:2020-05-25 00:49
【摘要】:背景:线性回归和logistic回归模型被广泛地应用于各种类型的医学研究,但是其对应样本量的具体需要,在很长一段时间都没有相关研究进行具体阐述。而更多时候是统计学家们在长期的研究工作中,根据经验总结出的一些一般准则。直到20世纪四五十年代,统计学家开始逐渐关注性回归和logistic回归模型的样本量估计方法。因此,国内外也开始逐步出现线性回归和logistic回归模型样本量估算方法的研究。在进入20世纪后,相关研究逐渐增多,为本研究提供了丰富的理论素材。在相关研究快速发展的同时,新的问题接踵而至。线性回归和logistic回归模型的样本量计算公式大多较为复杂、参数多、计算量大,且部分参数的取值区间不连续。这无疑阻碍了相关方法的推广应用。目的:梳理线性回归和logistic回归模型样本量估计方法进展,简化相关方法的知识结构。构建人机交互的图示化样本量计算平台,回避复杂的样本量计算公式,使其软件实现更加简便可靠。方法:通过对线性回归和logistic回归模型样本量计算方法学文献的系统检索和文献梳理,总结其在医学领域常用的样本量计算方法,选用常用模型常见情况、适用范围最广泛、参数简单容易理解的样本估计方法。借助R软件中shiny、ggplot2等软件包,制作图示化公式计算网页。在图示化界面设计时,充分考虑所选公式参数的理论取值范围,各模型不同情况下的计算公式,和参数的不同取值情况。对不同情况下的样本量计算公式,采用对应的图示化界面进行样本量计算。结果:本研究主要结果如下:(1)完成了线性回归和logistic回归样本量计算方法的发展过程梳理,总结了线性回归和logistic回归在各种情况下样本量计算方法的知识结构;(2)完成了线性回归和logistic回归样本量计算方法在不同情况下图示化计算的界面设计;(3)实现了线性回归和logistic回归样本量计算方法在不同情况下的图示化计算。(4)本文提供的计算界面可以较好的对样本量计算公式中的参数取值范围进行合理限制,避免使用时由于参数取值不合理而造成错误。结论:本文构建的图示化样本量计算界面,能较好的完成线性回归和logistic回归模型的样本量估算,可以简化相关样本量的计算过程。具有较好的实用价值。
【图文】:

样本量,领域分析,研究热点,多元回归模型


图 2 样本量研究热点领域分析情况Fig.2 Analysis of hot spots in sample size research1.1.2 线性回归和 logistic 模型的样本量计算方法研究在众多的统计方法当中,多元回归模型的使用非常普遍,尤其是从 20 世纪中叶,在传染病逐步得到控制,慢性病逐渐成为了威胁人类健康和生命的主要疾病。多元回归模型也被广泛的应用与各种慢性病危险因素的研究中。[9]进入 21 世纪后,随着生物信息学的兴起,多元回归模型也被广泛的应用于生物信息学的研究中[10]。线性回模型和 logistic 回归模型是多元回归模型中常用的两种建模方法。和其他多元回归模型一样,线性回模型和 logistic 回归模型往往需要较大的样本量。但在大多数情况下,研究者往往忽略了在模型的应用中,,样本量的考量问题。由于大多统计学或流行病学的著作都更多地关注模型本身,并未对模型的样本量需求做详细阐述。所以研究者对线性回模型和 logistic 回归模型进行应用时,往往是根据经

关系图,样本量,线性


故只有一个计算样本量的界面(见图 8)。图示化界面设置 (0~1)为连续可调参数,图 8 中, 可以手动输入最大值和最小值,也可以通过双向滑动条滑动取范围。从图 8 中可见,随着 与 的相关系数 的增加,模型所需要的样本量逐步减少,但是当相关系数大于 0.3 以后,样本量下降速度变缓。在进行样本量计算时,首先选定 。 采用下拉菜单选取。然后根据既往研究或预调查,指定 的可能存在区间(此区间可选用既往研究报道的 置信区间,注意: 取值不应该为 0 或者 1),即可得到在不同的 取值下, 随 变化的关系图。观察样本量与 的变化关系,并根据研究实际情况,调整其他参数的合理取值。最后根据研究需要,指定 值进行样本量计算,获取研究所需要的样本量。点击 界面可以看到在不同 取值下, 随样本量 的变化关系图。我们取了用户选取 的最大值、最小值和组中值在不同样本量情况下,检验效能的计算。在用最终选取 的检验效能随样本量的变化趋势线是介于 的最大值和最小值两条曲线之间(见图 9)。
【学位授予单位】:重庆医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R195.1

【相似文献】

相关期刊论文 前10条

1 ;影响样本量大小的几个因素[J];中国航天医药杂志;2004年03期

2 ;影响样本量大小的几个因素[J];中国航天医药杂志;2003年01期

3 ;影响样本量大小的几个因素[J];中国航天医药杂志;2003年03期

4 ;影响样本量大小的几个因素[J];中国航天医药杂志;2003年05期

5 ;影响样本量大小的几个因素[J];广东医学;2000年02期

6 ;影响样本量大小的几个因素[J];实用医学杂志;2000年01期

7 ;影响样本量大小的几个因素[J];广东医学;1998年06期

8 ;影响样本量大小的几个因素[J];广东医学;1998年09期

9 徐静远;;抽样调查中样本量的确定[J];统计与咨询;2009年04期

10 李大庆,李颢,王志萍,李会庆;基因与疾病研究的样本量计算方法[J];中国公共卫生;2004年07期

相关会议论文 前10条

1 尹婧;叶冬青;;研究基因与环境交互作用的样本量确定[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年

2 蒋志伟;于莉莉;李婵娟;夏结来;;生存资料成组序贯设计中的相关问题探讨[A];2011年中国卫生统计学年会会议论文集[C];2011年

3 田云鹏;;医学论文写作相关问题探讨[A];2014浙江省临床流行病学与循证医学学术年会论文汇编[C];2014年

4 施文;王永铭;程能能;陈斌艳;李端;钱亢;;非甾体抗炎药不良反应队列研究的样本量估计[A];中国药理学会第八次全国代表大会暨全国药理学术会议论文摘要汇编[C];2002年

5 王家启;田思泉;高小迪;高春霞;;不同调查目的的湖泊鱼类资源调查样本量优化设计[A];2017年中国水产学会学术年会论文摘要集[C];2017年

6 徐晨;陈平雁;;基于Bland-Altman法的医学参考值范围确定的样本量估计[A];2017年中国卫生统计学学术年会论文集[C];2017年

7 施文;王永铭;程能能;陈斌艳;李端;钱亢;;非甾体抗炎药不良反应队列研究的样本量估计[A];中国药理学会第八次全国代表大会论文摘要集(第一部分)[C];2002年

8 ;第二章数据采集[A];2010年中国省会城市公共治理指数报告[C];2011年

9 李三红;;谈顾客满意度调查的样本量确认[A];第二届中国质量学术论坛会议论文集[C];2005年

10 杨进波;;新药在临床试验中样本量的基本考虑[A];2008第十一次全国临床药理学学术大会论文集[C];2008年

相关重要报纸文章 前8条

1 本报记者 韩晓东;PMI将扩大样本量和推出细化指数[N];中国证券报;2012年

2 记者 王晔君;中国制造业PMI样本量扩大近3倍[N];北京商报;2013年

3 记者 汪时锋;中国PMI指数样本将扩容[N];第一财经日报;2012年

4 本报记者  管学军;J.D.Power:在中国的《报告》和美国一样[N];中国工业报;2006年

5 通讯员  张未来 张鹏飞 记者  杨月清;我省部署第二次全国残疾人抽样调查工作[N];陕西日报;2006年

6 杨学聪;千余普查员今起入户摸“家底”[N];北京日报;2007年

7 通讯员 安燕玲 戴玮芳;我市服务业呈现稳步发展态势[N];临汾日报;2012年

8 魏武;全国道德模范评选投票计票工作高效开展[N];人民日报;2007年

相关博士学位论文 前6条

1 黄丽红;临床试验期中分析中的两个统计学问题[D];南京医科大学;2017年

2 王素珍;自适应设计中样本量调整问题的研究及Web实现[D];第四军医大学;2008年

3 吴利丰;分数阶灰色预测模型及其应用研究[D];南京航空航天大学;2015年

4 董光玲;基于贝叶斯理论的靶场试验综合设计方法研究[D];哈尔滨工业大学;2016年

5 邱世芳;流行病学研究中有关风险差的若干问题研究[D];云南大学;2010年

6 曹红艳;基于惩罚回归的纵向数据罕见变异关联分析[D];山西医科大学;2017年

相关硕士学位论文 前10条

1 夏万元;线性回归和logistic回归模型样本量计算的图示化探索研究[D];重庆医科大学;2019年

2 周憧憧;非独立共同终点非劣效临床试验样本量估计[D];南京医科大学;2019年

3 何杰;无金标准二重抽样设计下基于风险差的等价性检验及样本量的确定[D];重庆理工大学;2019年

4 朱典;生存资料盲态下样本量再估计方法研究[D];中国人民解放军空军军医大学;2018年

5 门力闯;临床试验中利用条件把握度的方法进行样本量再估计[D];华东师范大学;2013年

6 易大莉;临床试验样本量交互式估计的图视化研究[D];第三军医大学;2017年

7 韩栋;生存分析中非劣效临床试验样本量估计方法研究[D];南方医科大学;2013年

8 傅丹峰;增强型CBET:对样本量和精密度分析的优化[D];复旦大学;2014年

9 孙亚清;Logistic回归样本量确定所需自变量事件数的模拟研究[D];南方医科大学;2016年

10 蔡伟斌;Monte Carlo模拟在Wilcoxon秩和检验样本量估计中的应用及其SAS实现[D];华中科技大学;2012年



本文编号:2679279

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2679279.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ea670***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com