基于互联网搜索数据的流感监测模型比较与优化
发布时间:2017-07-13 15:22
本文关键词:基于互联网搜索数据的流感监测模型比较与优化
【摘要】:[目的 /意义]分析国内互联网搜索数据和我国流感疫情的相关性,探讨利用搜索数据辅助流行病监测的应用可能,为相关搜索引擎和疾病防控中心提供参考。[方法 /过程]通过分析百度中文搜索词搜索情况和我国流感活动情况的相关性,选择合适的搜索关键词,构建并比较一元线性回归、多元线性回归、主成分回归及人工神经网络模型,选出最优模型;引入官方发布的流感监测历史信息,进行模型优化。[结果 /结论]多元线性回归和人工神经网络模型具有更好的拟合优度,其中多元线性回归的精度更高;主成分回归模型在理论上可以减少变量之间的共线性,但实践证明无论是其拟合效果还是监测效果相对于多元回归模型来说都有所下降;历史数据和搜索数据包含的信息具有一定程度的互补性,综合使用两种数据具有最好的监测效果。
【作者单位】: 北京大学信息管理系;天津图书馆;
【关键词】: 流感 搜索引擎 百度指数 监测模型
【分类号】:TP391.1;TP183
【正文快照】: 1引言由于传统流行病监测的报告数据严重滞后于疾病爆发时间,因此一些科研人员尝试使用其他和疾病相关的数据进行实时监测。2003年,有学者提出可以通过监测非处方药的销售量数据预测临床疾病变化,辅助公共卫生工作人员进行流行病早期预警[1-2];2004年,H.A.Johnson等人研究了健
【相似文献】
中国期刊全文数据库 前1条
1 李秀婷;刘凡;董纪昌;吕本富;;基于互联网搜索数据的中国流感监测[J];系统工程理论与实践;2013年12期
,本文编号:537442
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/537442.html