10.19981/j.CN23-1581/G3.2022.08.010
基于爬虫技术的医疗行业舆情监控系统的设计与实现
步入21世纪信息化时代,微博作为时下中国最流行的社交软件之一,已然成为海量舆情信息最为重要的源头.而2020年的一场新冠肺炎席卷全球,把医疗行业推向舆论的顶峰.本研究课题以Python作为开发语言,尝试设计出一套基于爬虫技术的医疗行业网络舆情监控系统.具体工作如下,通过通用爬虫对微博上海量医疗卫生行业的舆情信息进行抓取,主要使用自然语言处理、LDA聚类和关键词提取等技术对数据源进行处理并进行情感倾向分析,后将分析结果和数据信息以可视化图像的形式展现出来,为有关部门引导舆论走向提供力所能及的帮助.该系统包括舆情获取、数据源处理、舆情应用和系统管理4大模块,主要实现用户注册和登录、数据信息可视化展示、负面舆情预警和关键词搜索等功能.
网络爬虫、医疗行业、舆情监控、数据挖掘、Python
12
TP391(计算技术、计算机技术)
国家自然科学基金61575131
2022-04-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
27-29