10.11925/infotech.2096-3467.2021.0679
基于AttentionSBGMC模型的引文情感和引文目的自动分类研究
[目的]提出AttentionSBGMC深度学习模型,以提升引文情感和引文目的分类的性能.[方法]采用SciBERT预训练模型得到语料集中句子的语义表示向量,根据文本特点,依次通过BiGRU神经网络和多尺度卷积神经网络(Multi-CNN)提取句子中的时序全局特征和局部关键特征,引入注意力机制对提取出的特征重新分配权重,达到突出关键特征的目的,最后通过线性层实现引文情感和引文目的自动分类.[结果]在Abu-Jbara数据集上,引文情感主客观、引文情感正负面、引文目的三项分类任务的F1值分别为86.74%、91.14%和84.92%;在Athar数据集上,引文情感主客观、引文情感正负面两项分类任务的F1值分别为88.50%和86.59%.[局限]鉴于公开的引文数据集的有限性,该模型仅在两个英文数据集上进行验证,在其他数据集上的泛化性能有待进一步验证.[结论]所提AttentionSBGMC深度学习模型能全面、有效地提取出语料文本中的重要特征,可以更为准确地实现引文情感和引文目的自动分类.
引用情感分类;SciBERT;注意力机制;BiGRU;Multi-CNN
5
TP391(计算技术、计算机技术)
国家自然科学基金71473034
2022-02-28(万方平台首次上网日期,不代表论文的发表时间)
共12页
48-59