10.3969/j.issn.1003-0077.2020.06.006
面向医疗文本的实体及关系标注平台的构建及应用
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用.对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础.传统的人工标注方法费力费时,已难以适应大数据发展的需求.该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台.该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能.利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率.同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性.
文本标注、标注平台、实体标注、关系标注、数据分析
34
TP391(计算技术、计算机技术)
国 家 重 点 研 发 计 划 ;国 家 社 会 科 学 基 金 ;中 国 博 士 后 科 学 基 金;河南省科技攻关项目;河南省医学科技攻关计划省部共建项目;河南省高等学校重点科研项目
2020-07-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
36-44