10.3772/j.issn.1000-0135.2023.03.006
基于机器阅读理解的古文事件抽取研究
准确地梳理古文典籍脉络,抽取典籍中蕴含的事件和事件论元,对古籍从文本数据向智能化数据转化具有重要意义.针对古文事件的抽取研究主要有基于模式匹配、机器学习和神经网络三种方式,本文在现有的基于神经网络的方法中融入机器阅读理解模式,将事件抽取中出现的"事件类型"和"论元角色"糅合为问题形式,由此输出的答案即为事件论元.分别选取编年体史书《左传》和纪传体史书《史记》作为训练和泛化的数据,在具体的泛化过程中引入混淆句以验证模型效果,为古文事件抽取提供了可参照的思路.
古籍文本、机器阅读理解、事件抽取、RoBERTa、混淆句
42
TP393.08;H146.3;TP181
国家社会科学基金18BTQ063
2023-06-09(万方平台首次上网日期,不代表论文的发表时间)
共11页
316-326