基于统计学习理论的传染病预警方法研究比较
本文关键词:基于统计学习理论的传染病预警方法研究比较 出处:《辽宁师范大学》2016年硕士论文 论文类型:学位论文
更多相关文章: 结构方程模型 人工神经网络 随机森林模型 统计学习
【摘要】:在所有的突发公共卫生安全事件中,影响最严重的当属传染病疫情的爆发。传染病疫情的爆发不仅影响人们的正常出行,还容易造成社会大众的心理恐慌,造成国家经济和社会方方面面的动荡局面。而传染病预测预警技术的产生与发展,对防范传染病爆发,及时有效的采取应对措施就显得尤为重要。在诸多统计学学习理论中,应用于预测预警方面的方法有很多并且表现都不错。本文主要选取了三种常用的统计模型,选取传染病中的结核病为对象,通过对收集到的结核病数据进行统计分析,应用10折交叉检验的方发比较得出在结核病预测预警方面表现比较好的模型。本文首先介绍了突发传染病事件近些年来的状况以及它给人们的生活带来的影响。同时介绍了各个国家面对突发事件做出了哪些应对措施,通过分析各个国家应用不同统计方法预测传染病模型的优缺点,最终本文选择了三种统计模型,以结核病为传染病的代表,比较分析这三种模型在传染病的预测预警方面的表现。其次,分别介绍了结构方程模型、人工神经网络模型和随机森林模型这三种模型的基础理论知识。最后进行实证分析。应用R软件程序语言,对收集到的大连市各个学校的结核病数据进行数据处理分析。结果得到结构方程模型可以将不可观测的隐变量用多个可观测的指标表示出来,而且能很好的表示隐变量之间的因果关系。但结构方程的局限性是它本身是一种验证性的模型,因此不同的模型可能出现不同的结果。人工神经网络的非线性处理能力很好,但是容易出现过拟合现象。随机森林处理数据过程快,而且不容易发生过拟合现象。从人工神经网络和随机森立的10折交叉验证结果显示,随机森林模型的拟合度更高,更稳定。
[Abstract]:In all the sudden public health and safety incidents, the most serious impact is the outbreak of infectious disease. The outbreak of infectious disease not only affects the normal travel of people, but also easily cause psychological panic of the general public. The emergence and development of early warning technology for infectious diseases will prevent the outbreak of infectious diseases. Timely and effective measures are particularly important. In many statistical learning theory. There are many methods used in forecasting and early warning, and the performance is good. This paper mainly selects three commonly used statistical models, select tuberculosis in infectious diseases as the object. Through the collection of tuberculosis data for statistical analysis. By using the 10% cross test, the model of TB prediction and early warning is obtained. This paper first introduces the situation of emergent infectious diseases in recent years and its impact on people's lives. At the same time, it introduces the response measures that each country has made in the face of emergency. By analyzing the advantages and disadvantages of using different statistical methods to predict infectious disease models in different countries, three statistical models were selected in this paper, with tuberculosis as the representative of infectious diseases. The performance of these three models in the prediction and early warning of infectious diseases is compared and analyzed. Secondly, the structural equation models are introduced respectively. The basic theoretical knowledge of artificial neural network model and stochastic forest model. Finally, the empirical analysis. Using R software programming language. The data of tuberculosis collected from every school in Dalian were analyzed. The results showed that the unobservable hidden variables could be expressed by multiple observable indexes in the structural equation model. But the limitation of structural equation is that it is a kind of confirmatory model. Therefore, different models may have different results. Artificial neural network has good nonlinear processing ability, but it is prone to over-fit phenomenon. The data process of stochastic forest processing is fast. From the results of artificial neural network and 10 fold cross validation of random forest model, the fitting degree of stochastic forest model is higher and more stable.
【学位授予单位】:辽宁师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R181.8
【相似文献】
相关期刊论文 前10条
1 钱维;王超;吴骋;许金芳;叶小飞;杜文民;贺佳;;运用随机森林分析药品不良反应发生的影响因素[J];中国卫生统计;2013年02期
2 武晓岩;李康;;随机森林方法在基因表达数据分析中的应用及研究进展[J];中国卫生统计;2009年04期
3 李贞子;张涛;武晓岩;李康;;随机森林回归分析及在代谢调控关系研究中的应用[J];中国卫生统计;2012年02期
4 刘永春;宋弘;;基于随机森林的乳腺肿瘤诊断研究[J];电视技术;2014年15期
5 聂斌;王卓;杜建强;朱明峰;林剑鸣;艾国平;熊玲珠;;基于粗糙集和随机森林算法辅助糖尿病并发症分类研究[J];江西师范大学学报(自然科学版);2014年03期
6 武晓岩;李康;;基因表达数据判别分析的随机森林方法[J];中国卫生统计;2006年06期
7 武晓岩;闫晓光;李康;;基因表达数据的随机森林逐步判别分析方法[J];中国卫生统计;2007年02期
8 马广立;赵筱萍;程翼宇;;基于随机森林与Chemistry Development Kit描述符的P-gp底物识别[J];高等学校化学学报;2007年10期
9 苑婕;李晓杰;陈超;宋向岗;王淑美;;基于随机森林算法的川芎成分-靶点-疾病网络的预测研究[J];中国中药杂志;2014年12期
10 ;[J];;年期
相关会议论文 前7条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
3 张天龙;梁龙;王康;李华;;随机森林结合激光诱导击穿光谱技术用于的钢铁分类[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
4 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
相关博士学位论文 前5条
1 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年
2 曹正凤;随机森林算法优化研究[D];首都经济贸易大学;2014年
3 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
4 岳明;基于随机森林和规则集成法的酒类市场预测与发展战略[D];天津大学;2008年
5 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
相关硕士学位论文 前10条
1 钱维;药品不良反应监测中随机森林方法的建立与实现[D];第二军医大学;2012年
2 韩燕龙;基于随机森林的指数化投资组合构建研究[D];华南理工大学;2015年
3 贺捷;随机森林在文本分类中的应用[D];华南理工大学;2015年
4 张文婷;交通环境下基于改进霍夫森林的目标检测与跟踪[D];华南理工大学;2015年
5 李强;基于多视角特征融合与随机森林的蛋白质结晶预测[D];南京理工大学;2015年
6 朱玟谦;一种收敛性随机森林在人脸检测中的应用研究[D];武汉理工大学;2015年
7 肖宇;基于序列图像的手势检测与识别算法研究[D];电子科技大学;2014年
8 李慧;一种改进的随机森林并行分类方法在运营商大数据的应用[D];电子科技大学;2015年
9 赵亚红;面向多类标分类的随机森林算法研究[D];哈尔滨工业大学;2014年
10 黎成;基于随机森林和ReliefF的致病SNP识别方法[D];西安电子科技大学;2014年
,本文编号:1439762
本文链接:https://www.wllwen.com/yixuelunwen/liuxingb/1439762.html