10.3969/j.issn.1002-1965.2022.01.009
基于事件抽取技术的听证公开文本挖掘方法研究
[研究目的]为了帮助政府、企业和科研人员从海量的听证公开文本中发现科技相关政策和热点,快速、全面地识别出有价值的信息.[研究方法]梳理听证公开文本的类型与特点,并对其中有价值的信息进行合理的界定与分类;根据文本的内容特征和话语特征提出事件句识别、事件类型检测和事件论元抽取的三阶段式事件抽取方法,以实现有价值信息的抽取;对抽取的有价值信息进行深入分析.[研究结论]与基准模型相比,该研究所提方法在事件句识别召回率上提高33%,F1提高17%,在事件类型检测的精确率上提高1%,在事件论元抽取的精确率上提高18%,召回率提高4%,取得了一定效果,为此类文本进一步分析提供了新研究思路.
信息抽取、事件抽取、听证公开文本、文本分析
41
G350.7(情报学、情报工作)
中国科学技术信息研究所重点工作项目;中国工程科技知识中心基金项目;中国科学技术信息研究所创新基金项目
2022-04-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
52-59,30