基于冬奥会新闻的命名实体识别及可视化
随着2022年冬奥会的到来,冬奥会新闻数据急剧增加.从冬奥会新闻数据中提取实体并进行可视化,对研究冬奥会进度具有重要作用.针对冬奥会新闻数据实体识别问题,提出基于BERT-BiLSTM-CRF命名实体识别模型.根据实体识别结果,从时间和空间两方面分析冬奥会新闻文本数据,可视化地展示此次冬奥会的相关信息.在时间维度,通过在新闻中提取的时间日期制作日历图,以时间作为支撑了解不同时间节点的事件频率.在空间维度,通过对新闻文本中地点的提取进行地理统计分析,直观地了解新闻事件的空间分布.
冬奥会新闻、网络爬虫、命名实体识别、可视化、地理统计分析
18
TP391(计算技术、计算机技术)
2022-05-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
85-88