DOI：10.11925/infotech.2096-3467.2021.1020

融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究

全文直达

下载全文

在线阅读

引用

摘要：

[目的]识别中文成语情感隐喻,构建融合字面外在事物(源域知识)以及隐喻使用者内在态度或情感(目标域知识)的成语知识图谱.[方法]提出一套融合迁移学习和文本增强的成语情感隐喻知识识别方案.首先,爬取成语及其外在事物类别获取外部知识;随后,迁移情感词典获取学习语料,将成语集和情感词典匹配到的成语用于第一轮迁移学习,将情感词典中除首轮测试集的所有情感词作为训练集进行第二轮迁移;引入汉语知识增强文本数据克服成语隐喻特征所导致的弱情感语义,对比BERT嵌入的[CLS]与平均池化方案,采取主流深度学习模型进行验证;归纳最优模型对未匹配的成语进行层次分类并将其与匹配到的合并获得成语内部知识.[结果]平均池化的准确率相较[CLS]提升4.69个百分点,加入成语释义使准确率提升超过13个百分点;第二轮迁移的各级情感精度多在80％以上,原先语料规模较小的情感类别提升最高可达6.25个百分点.[局限]受限于部分情感类别语料数量,分类精度有待提升.[结论]本文方案能够有效识别成语的情感隐喻知识,内外知识的关联为成语知识服务打下了基础.

关键词：成语知识图谱、隐喻知识、迁移学习、文本增强、多层情感分类

所属期刊栏目：6

分类号：G202;TP391(信息与传播理论)

资助基金：国家自然科学基金;江苏省研究生科研创新计划项目;中央高校基本科研业务费项目

在线出版日期：2022-06-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共17页

页码：167-183

英文信息展示

期刊专题