10.16208/j.issn1000-7024.2020.05.033
面向并购重组类公告的信息抽取
并购重组类公告是上市公司进行信息披露的重要组成,属于具有一定格式规范的自由长文本.针对公告文本特点,借鉴降维思想,提出规则法和序列标注法相结合的联合信息抽取方案.采用规则法,抽取关键句子集合,将"篇章级"抽取缩小为"句子级"抽取;采用序列标注法,构建基于双向门控循环(BiGRU)网络和注意力机制(Attention)的序列标注模型,实现"句子级"到"字段级"的抽取.实验结果表明,该方案在并购重组类公告信息抽取任务中,取得了平均F1值0.92的较好结果,验证其具有一定的可行性和实用性.
信息抽取、自由长文本、规则法、序列标注法、双向门控循环网络、注意力机制
41
TP391(计算技术、计算机技术)
国家自然科学基金项目61371096
2020-05-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
1420-1426