基于BERT的中文命名实体识别方法
针对传统的机器学习算法对中文实体识别准确率低、高度依赖特征设计以及领域自适应能力差的问题,提出了基于BERT的神经网络方法进行命名实体识别.首先,利用大规模未标注语料对BERT进行训练,获取文本抽象特征;然后,利用BiLSTM神经网络获取序列化文本的上下文抽象特征;最后,通过CRF进行序列解码标注,提取出相应的实体.该方法结合BERT和BiLSTM-CRF模型对中文实体进行识别,以无需添加任何特征的方式在1998上半年人民日报数据集上取得了94.86%的F1值.实验表明,该方法提升了实体识别的准确率、召回率及F1值,验证了该方法的有效性.
BERT、命名实体识别、序列标注、BiLSTM、条件随机场
46
TP391(计算技术、计算机技术)
贵州省科学技术基金黔科合J字[2015]2045
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
138-142