基于Web数据挖掘的COVID-19流行病学特征分析
基于Selenium数据挖掘技术,通过对2020年2月4日-22日新浪微博"肺炎患者求助超话"中690例有效病例的分析,获得了新浪微博中真实求助病例的流行病学特征.研究发现,求助患者97.6%来自于武汉,重点集中在武昌、硚口、汉阳等中心城区,与当地的医疗资源和人口密度成正比.微博求助病例主要分布在2020年2月4日-7日,随着医疗资源紧张程度的缓解,通过微博求助的病例明显减少.求助患者确诊日期主要分布在2020年1月16日-2月6日,与中国疾控中心发布的病例分布情况基本一致.求助患者年龄分布中位数为60岁,明显高于中国疾控中心发布的数据,但与武汉市中心医院的数据基本吻合.该文研究结果说明,针对重大突发性传染病,微博等社交媒体除了在舆论传播上发挥作用,在流行病学分析上也具有重要意义.基于社交媒体的实时性和广泛性,结合数据挖掘和大数据分析等方法,有助于决策层快速掌握一线真实情况.
新冠肺炎、数据挖掘、流行病学、社交媒体
49
TP391(计算技术、计算机技术)
国家自然科学基金;冲击与安全工程教育部重点实验室开放基金
2020-06-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
408-414