基于Twitter社交网络数据的流感预测应用研究
发布时间:2024-01-19 15:22
随着全球气候变化,流感的发病人数大幅增加,严重流感的死亡率接近50%,因此对流感暴发进行预测研究愈发重要。现有研究中,已将社交媒体用于地震灾害检测和趋势预测,本研究将机器学习算法和大数据方法结合应用于流感暴发的预测。通过文本分类模型实现Twitter社交网络数据预处理,利用时间序列预测模型对澳大利亚昆士兰州的流感疫情进行趋势预测。本文主要研究内容如下:1)应用XGBoost算法实现流感数据文本分类,解决了传统机器学习算法对于文本分类效果较差的问题。为了验证该方法的性能,以Twitter数据为研究对象,首先通过关键词过滤技术提取疑似流感数据,然后采用XGBoost算法对疑似流感数据进行分类预测,并与传统的朴素贝叶斯算法进行对比。实验结果表明,XGBoost算法对Twitter数据的分类结果正确率为90%,明显优于朴素贝叶斯算法的分类结果,可用于Twitter数据中流感发病频率及发病时间的提取。2)提出基于Twitter数据和温度数据的多元时间序列预测模型,解决了一元时间序列预测模型时效性差、预测结果相对误差较高的问题。首先通过2015年第1周至2017年第32周的流感历史数据,建立ARI...
【文章页数】:62 页
【学位级别】:硕士
本文编号:3880035
【文章页数】:62 页
【学位级别】:硕士
本文编号:3880035
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3880035.html