融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11925/infotech.2096-3467.2021.1020

融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究

引用
[目的]识别中文成语情感隐喻,构建融合字面外在事物(源域知识)以及隐喻使用者内在态度或情感(目标域知识)的成语知识图谱.[方法]提出一套融合迁移学习和文本增强的成语情感隐喻知识识别方案.首先,爬取成语及其外在事物类别获取外部知识;随后,迁移情感词典获取学习语料,将成语集和情感词典匹配到的成语用于第一轮迁移学习,将情感词典中除首轮测试集的所有情感词作为训练集进行第二轮迁移;引入汉语知识增强文本数据克服成语隐喻特征所导致的弱情感语义,对比BERT嵌入的[CLS]与平均池化方案,采取主流深度学习模型进行验证;归纳最优模型对未匹配的成语进行层次分类并将其与匹配到的合并获得成语内部知识.[结果]平均池化的准确率相较[CLS]提升4.69个百分点,加入成语释义使准确率提升超过13个百分点;第二轮迁移的各级情感精度多在80%以上,原先语料规模较小的情感类别提升最高可达6.25个百分点.[局限]受限于部分情感类别语料数量,分类精度有待提升.[结论]本文方案能够有效识别成语的情感隐喻知识,内外知识的关联为成语知识服务打下了基础.

成语知识图谱、隐喻知识、迁移学习、文本增强、多层情感分类

6

G202;TP391(信息与传播理论)

国家自然科学基金;江苏省研究生科研创新计划项目;中央高校基本科研业务费项目

2022-06-23(万方平台首次上网日期,不代表论文的发表时间)

共17页

167-183

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

6

2022,6(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn