10.3969/j.issn.1673-629X.2021.11.004
基于BERT模型的科研人才领域命名实体识别
科研人才的发现和挖掘不仅可为学者画像、研究领域热度分析、科研成果预测等诸多环节提供基础信息支撑,也是提升精准服务科研人才和推动前沿科技智能化水平的关键技术.针对传统机器学习算法对科研人才领域命名实体识别准确效率低、高度依赖语料库以及分词不准确等问题,文中面向科研人才的基础属性和科研属性,对该领域命名实体进行了类别和标注符号的定义,形成了7大类共计19小类的命名实体.通过使用BERT模型生成词向量,结合BiLSTM对上下文关系的记忆能力和CRF对标注规则的学习能力,构建了面向科研人才领域的命名实体识别BERT-BiLSTM-CRF模型.模型在包含6134条科研咨询语料库中进行了训练和参数微调,对网络爬取的科研人才相关数据上测试结果表明,该模型取得了较好的识别效果.
BERT模型;命名实体识别;科研人才;机器学习;自然语言处理
31
TP181(自动化基础理论)
江苏省重点研发计划BE2018754
2021-11-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
21-27