10.3969/j.issn.1673-3908.2022.05.015
基于BERT-BiLSTM-CRF的农产品信息文本命名实体识别研究及应用展望
命名实体识别是从农产品信息文本数据中有效抽取信息的关键一步,旨在从非结构化文本中确定与农产品特性相关的命名实体.农业领域的命名实体识别研究大多集中在农业病虫害领域,关于农产品信息文本的实体识别研究较少,通过采用BMES标注的方式对爬虫获取的农产品信息文本数据进行标注,提出融合BERT的BiLSTM-CRF深度学习模型对该文本数据进行实体抽取.将该模型与多种神经网络模型的实验结果比较发现,融合BERT的BiL-STM-CRF模型对农作物、地区、富含营养成分等3种命名实体识别的准确率和召回率分别为82.25%和84.54%,明显优于IDCNN-CRF等神经网络模型,说明该方法能有效识别抽取农产品信息文本数据命名实体.基于此,命名实体识别作为中文文本信息抽取的关键技术,在农产品信息推荐系统、智能问答等方面将会有广泛的应用前景.
农产品信息、命名实体识别、深度学习模型、信息抽取
18
TP311;TP181;TN91
中国农业科学院科技创新工程项目CAAS-ASTIP-201X-AII
2022-12-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
105-111