10.14188/j.1671-8836.2020.0045
基于微博的COVID-19热点话题分析
新型冠状病毒肺炎(corona virus disease 2019,COVID-19)的快速暴发引发了广泛的社会关注,给网络舆情分析带来了极大的挑战.针对这个问题,本文使用网络爬虫技术对官方媒体发布的关于COVID-19的评论信息进行数据收集,对收集到的评论信息按时间顺序进行排列,首先使用TF-IDF对文本的关键特征词进行提取,其次利用OLDA (online latent Dirichlet allocation)模型依照时间顺序进行主题词演化分析,构建评论集词向量模型,最后使用K-means对主题进行聚类,并对聚类结果通过词性标注进行分析.实验表明,本文的方法可以获得随时间变化的评论信息,能够检测到需要关注的信息.
新型冠状病毒肺炎、舆情分析、OLDA、TF-IDF、K-means、word2vec
66
TP391.1(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;江西省经济犯罪侦查与防控技术协同创新中心开放基金资助课题
2021-04-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
425-432