基于小样本学习的中文文本关系抽取方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.14132/j.cnki.1673-5439.2023.04.009

基于小样本学习的中文文本关系抽取方法

引用
实体关系抽取作为文本挖掘和信息抽取的核心任务,是知识图谱构建过程中的关键一环.然而人工建立大规模有标签的数据耗时耗力.使用小样本学习来进行关系抽取,仅仅需要少量样本实例就能使模型学会区分不同关系类型的能力,从而缓解大量无标签数据带来的标注压力.本文对中文关系抽取数据集FinRE进行了重构使之适用于少样本学习,并引入了语义关系网络HowNet对实体进行更为精确的语义划分,并在此基础上使用双重注意力机制提高句子编码质量,从而提高了模型在面对噪声数据时的效能,减轻了长尾关系的影响.使用本文的方法在该中文数据集进行了评估,与原始原型网络相比,基于句子级别与实体级别的注意力机制的原型网络在抽取准确率上提升了 1%-2%的性能.

小样本学习、关系抽取、BERT、HowNet、注意力机制

43

TP391(计算技术、计算机技术)

国家重点研发计划;国家重点研发计划;江苏省重点研发计划;中电鸿信信息科技有限公司合作项目;江苏省自然科学基金;江苏省高校自然科学研究重大项目;江苏省高校自然科学研究重大项目;江苏省创新创业人才项目;江苏博士后基金;江苏省博士后研究实践创新项目;南京邮电大学鼎山人才培养对象项目;南京邮电大学引进人才科研启动基金资助项目

2023-10-17(万方平台首次上网日期,不代表论文的发表时间)

共8页

64-71

相关文献
评论
暂无封面信息
查看本期封面目录

南京邮电大学学报(自然科学版)

1673-5439

32-1772/TN

43

2023,43(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn