10.12011/1000-6788-2018-0386-09
基于百度热搜新闻词的社会风险事件5W提取研究
当今中国处于经济转型升级的关键时期,社会主要矛盾发生了历史性交化,社会风险事件发生的频率比以往更高,危害社会稳定.将公众在线的搜索和关注数据映射为潜在的社会风险事件,如何有效地自动标注风险事件以及直观、清晰地描述社会风险事件是本文关注的重点.本文尝试定义风险事件的5W框架来结构化的描述社会风险,包括地点(where)、时间(when)、人物(who)、原因(why)和发生内容(what).风险事件的5W抽取可转化为不同的机器学习任务,包括命名实体识别、风险分类以及关键词抽取.依据5W的抽取任务进而探索有效的抽取方法.通过对风险事件5W的自动抽取,将现实中社会风险这种wicked问题转化为结构化问题进行分析,为研究社会风险提供一个新的视角,对政府部门进行舆情分析与风险监测具有重要意义.
热搜新闻词、社会风险事件、5W、条件随机场、风险主题词
40
TP391;C91(计算技术、计算机技术)
国家重点研发计划基金;国家自然科学基金
2020-05-07(万方平台首次上网日期,不代表论文的发表时间)
共9页
334-342