基于Transformer与技术词信息的知识产权实体识别方法
专利文本中包含了大量实体信息,通过命名实体识别可以从中抽取包含关键信息的知识产权实体信息,帮助研究人员更快了解专利内容.现有的命名实体提取方法难以充分利用专业词汇变化带来的词层面的语义信息.本文提出基于Transformer和技术词信息的知识产权实体提取方法,结合BERT语言方法提供精准的字向量表示,并在字向量生成过程中,加入利用字向量经迭代膨胀卷积网络提取的技术词信息,提高对知识产权实体的表征能力.最后使用引入相对位置编码的Transformer编码器,从字向量序列中学习文本的深层语义信息,并实现实体标签预测.在公开数据集和标注的专利数据集的实验结果表明,该方法提升了实体识别的准确性.
中文命名实体识别、知识产权、Transformer编码器、信息融合、向量表示、科技大数据、专利、深度学习
18
TP391(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金
2023-03-03(万方平台首次上网日期,不代表论文的发表时间)
共8页
186-193