10.13266/j.issn.0252-3116.2016.18.015
基于互联网搜索数据的流感监测模型比较与优化
[目的/意义]分析国内互联网搜索数据和我国流感疫情的相关性,探讨利用搜索数据辅助流行病监测的应用可能,为相关搜索引擎和疾病防控中心提供参考.[方法/过程]通过分析百度中文搜索词搜索情况和我国流感活动情况的相关性,选择合适的搜索关键词,构建并比较一元线性回归、多元线性回归、主成分回归及人工神经网络模型,选出最优模型;引入官方发布的流感监测历史信息,进行模型优化.[结果/结论]多元线性回归和人工神经网络模型具有更好的拟合优度,其中多元线性回归的精度更高;主成分回归模型在理论上可以减少变量之间的共线性,但实践证明无论是其拟合效果还是监测效果相对于多元回归模型来说都有所下降;历史数据和搜索数据包含的信息具有一定程度的互补性,综合使用两种数据具有最好的监测效果.
流感、搜索引擎、百度指数、监测模型
G250(图书馆学、图书馆事业)
2016-11-17(万方平台首次上网日期,不代表论文的发表时间)
122-132