基于LASSO回归模型与百度搜索数据构建的流感疫情预测系统
本文选题:Bagging + LASSO ; 参考:《中国卫生统计》2017年02期
【摘要】:目的探讨基于LASSO回归模型与百度搜索数据构建流感疫情预测系统的可行性。方法采用Bagging方法和模型性能的多指标优化评估策略,对传统LASSO回归模型进行改进,构建性能提升的集成LASSO回归模型,将其应用于中国大陆地区季节性流感流行趋势的预测研究。结果与传统LASSO回归模型相比,本研究所构建的集成LASSO回归模型对2011年至2015年中国大陆地区流感流行趋势的预测偏差更小,说明集成LASSO回归模型的外部推断能力更强,适合于流感疫情的预测分析;本研究开发了开源的R软件程序包Sparse Learner,方便用户进行调用和进一步开发研究。结论 Bagging方法和多指标优化评估策略相结合所构建的集成LASSO回归模型,有效地增强了传统LASSO回归模型的性能。本研究所构建的预测模型可以应用于流感等传染病疫情的预测研究。
[Abstract]:Objective to explore the feasibility of constructing influenza epidemic forecasting system based on LASSO regression model and Baidu search data. Methods by using bagging method and multi-index optimization evaluation strategy of model performance, the traditional LASSO regression model was improved, and an integrated LASSO regression model with improved performance was constructed, which was applied to predict seasonal influenza epidemic trend in mainland China. Results compared with the traditional LASSO regression model, the integrated LASSO regression model constructed in this study has a lower prediction deviation to the influenza epidemic trend in mainland China from 2011 to 2015, which indicates that the integrated LASSO regression model has stronger external inference ability than the traditional LASSO regression model. It is suitable for the prediction and analysis of influenza epidemic. In this study, open source R software package Sparse Learneris developed, which is convenient for users to call and further research. Conclusion the integrated LASSO regression model based on bagging method and multi-index optimization evaluation strategy can effectively enhance the performance of the traditional LASSO regression model. The prediction model can be used to predict the epidemic situation of infectious diseases such as influenza.
【作者单位】: 汕头大学医学院公共卫生与预防医学教研室;中山大学公共卫生学院医学统计与流行病学系;中山大学卫生信息中心、广东省卫生信息学重点实验室;
【分类号】:R511.7
【相似文献】
相关期刊论文 前10条
1 徐英;骆福添;;COX回归模型的样本含量的计算方法及软件实现[J];数理医药学杂志;2008年01期
2 郭孙伟,张照寰,许世瑾,沈福民;Cox回归模型及其在医学中的应用[J];上海第一医学院学报;1985年04期
3 恽振先;;Cox回归模型及其在急性非淋巴细胞白血病预后因素分析中的应用[J];铁道医学;1988年02期
4 黄小兰;;比较几种挑选“最优”回归模型的指标[J];中国卫生统计;1988年04期
5 恽振先;;多个回归模型的比较方法[J];中国公共卫生;1989年03期
6 黄文涌;李卫民;;Cox回归模型在临床疗效分析中的应用[J];贵阳医学院学报;1990年02期
7 姜潮;胡克震;刘宗航;乔友林;;四分类logistic回归模型对肺癌分组织类型的多因素研究[J];中国卫生统计;1993年01期
8 李丽霞;郜艳晖;周舒冬;徐英;张敏;叶小华;;二分类、多分类Logistic回归模型SAS程序实现的探讨[J];数理医药学杂志;2007年04期
9 丁建生;冯琪;;应用非条件Logistic回归模型的数据分层处理及应用程序[J];兰州医学院学报;1990年03期
10 沈洪兵,徐耀初;Logistic回归模型的适用条件及其局限性[J];中国公共卫生;1991年03期
相关会议论文 前10条
1 孙尚拱;何平平;;经典的用回归模型进行统计控制中的问题[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 张松松;沈竞;;回归模型和吉布斯抽样的研究[A];第十届中国不确定系统年会、第十四届中国青年信息与管理学者大会论文集[C];2012年
3 艾瑛;陈仲堂;孙海义;刘丹;;利用数学软件求解统计回归模型[A];第十一届沈阳科学学术年会暨中国汽车产业集聚区发展与合作论坛论文集(信息科学与工程技术分册)[C];2014年
4 古佳;;非参数回归模型的研究与应用[A];第十二届中国青年信息与管理学者大会论文集[C];2010年
5 阴拥民;徐聪颖;李卫华;唐峗;刘桂霞;;构建定量回归模型预测化合物性质[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
6 黄运隆;李晓钢;;基于时变系数扩展风险回归模型的可靠性预计[A];技术融合创新·可靠服务企业·安全产品制胜——2013年全国机械行业可靠性技术学术交流会暨第四届可靠性工程分会第五次全体委员大会论文集[C];2013年
7 张敏;;企业薪金制度设计的回归模型与应用[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
8 张波;沈其君;;Logistic回归模型中自变量相对重要性的可视化[A];2011年中国卫生统计学年会会议论文集[C];2011年
9 李志林;尹建华;;MATLAB软件在建立回归模型中的应用[A];中国现场统计研究会第12届学术年会论文集[C];2005年
10 吴利;张敏强;;固定效应与随机效应回归模型下效果量的置信区间、统计功效及样本容量的确定的比较研究[A];第十二届全国心理学学术大会论文摘要集[C];2009年
相关博士学位论文 前5条
1 田茂再;回归模型的诊断理论与应用[D];南开大学;2001年
2 李锋;非参和半参回归模型的稳健和截面推断[D];山东大学;2010年
3 杨玉娇;基于样条函数的两类回归模型的研究[D];华东师范大学;2013年
4 夏玮;几类数据下部分性单调回归模型的统计推断[D];中国科学技术大学;2013年
5 吴擰洪;时间序列中回归模型的诊断检验[D];华东师范大学;2007年
相关硕士学位论文 前10条
1 邓健康;基于级联回归模型的人脸配准研究[D];南京信息工程大学;2015年
2 孟祥虎;基因表达预测模型研究[D];西安电子科技大学;2014年
3 曹婷婷;我国消费者对保险信息的渴求研究[D];东北财经大学;2015年
4 田震;零一膨胀回归模型及其统计诊断[D];云南大学;2016年
5 李昊鑫;三维手姿态建模及其交互系统研究[D];电子科技大学;2016年
6 陈怡;一类模糊Logistic回归模型的参数估计[D];宁夏大学;2016年
7 杨顺华;基于空间回归模型的土壤有机质区域分布特征研究[D];华中农业大学;2016年
8 任莹莹;病例对照研究的Stereotype Logistic回归模型[D];南京师范大学;2015年
9 魏冰琪;协变量受区间约束的Logistic回归模型的同步置信带[D];东北师范大学;2016年
10 苏萧萧;基于样本效应的回归预测方法研究[D];河北科技大学;2016年
,本文编号:1993556
本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/1993556.html