10.3969/j.issn.1671-3982.2020.09.005
基于词典与CRF算法的中文生物医学实体自动标注平台建设
目的:构建中文生物医学实体及关系的自动识别标注平台,为中文生物医学语料标注和精准医学语料积累及知识服务等提供参考.方法:基于词典和CRF算法实现中文生物医学文本的自动实体识别,利用Python、JavaScript、CSS等编程语言和Query框架等相关工具构建中文生物医学实体自动标注平台.结果:构建了一个可以自动识别中文实体且具备上传、标注、审核文本并最终存储文本等功能的中文自动标注平台.该平台能高效、准确地识别文本内容,实现自动标注.结论:该平台具备了人工导入文献、标注、管理员审核结算的功能,可以为生物医学领域的研究者进行信息的数据挖掘、中文语料库的构建提供支持.
命名实体识别、语义关系、语义标注、知识图谱
29
P209;TP391.41(一般性问题)
2021-01-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
29-35