基于多来源文本的中文医学知识图谱的构建
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13705/j.issn.1671-6841.2019383

基于多来源文本的中文医学知识图谱的构建

引用
中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要.通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命名实体和实体关系的标注体系和规范;并开发了标注工具,在医学专家的指导下,选取106种高发疾病进行人工标注,命名实体一致率达到了87.3%,实体关系一致率达到了82.9%.在人工标注的基础上,进行实体及关系自动抽取,构建出的中文医学知识图谱CMeKG1.0版共包括6310种疾病、19853种药物(西药、中成药、中草药)、1237种诊疗技术及设备,关联到的医学实体达20余万,概念关系实例及属性三元组达100余万.所构建的中文医学知识图谱为医疗问答系统和智能辅助诊疗等领域奠定了专业知识基础.

医学知识图谱、命名实体、实体关系、标注规范、知识图谱构建

52

TP391.1(计算技术、计算机技术)

国家社科基金重大资助项目;河南省高等学校重点科研项目;河南省科技攻关项目;河南省科技攻关计划国际合作项目

2020-05-29(万方平台首次上网日期,不代表论文的发表时间)

共7页

45-51

相关文献
评论
暂无封面信息
查看本期封面目录

郑州大学学报(理学版)

1671-6841

41-1338/N

52

2020,52(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn