10.3969/j.issn.1002-1167.2022.12.021
面向古籍数字人文的《资治通鉴》自动摘要研究——以SikuBERT预训练模型为例
自动摘要能降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究很少.文章面向《资治通鉴》语料,基于SikuBERT预训练模型进行自动摘要实验,并对比其与传统抽取式自动摘要算法和百度智能云摘要分析算法在《资治通鉴》语料上的表现.实验结果表明:基于SikuBERT预训练模型生成的摘要结果在稳定性、覆盖度等方面较好;通过专家人工打分方式,基于SikuBERT预训练模型生成的摘要结果平均得分最高.实验验证了使用数字人文技术对古文进行自动摘要任务的可行性和利用SikuBERT预训练模型对古文进行信息处理的适用性.
数字人文、SikuBERT、预训练模型、自动摘要
42
G269;TP391;F224
国家社会科学基金;江苏高校哲学社会科学研究项目
2022-12-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
129-137