10.3969/j.issn.2095-5227.2020.07.022
乳腺癌病理文本的结构化信息提取
目的 对解放军总医院第一医学中心乳腺癌病理报告进行文本结构化信息提取,以支持临床分析研究.方法 通过总结解放军总医院第一医学中心2005-2017年共计1万余份乳腺癌病理报告结构及特点,结合临床科研需求和专家经验,整理结构化字段词典和抽取规则,利用基于规则的模式匹配抽取方法 对病理报告进行信息抽取.结果 利用该方法 得到临床科研所需乳腺病理文本结构化指标及其值,并对随机抽样的200条病理报告进行效果评估,结构化字段的召回率和准确率均高于90%.结论 基于规则的模式匹配信息提取方法 在乳腺癌病理报告中具有一定适用性,可快速、有效地实现对文本信息的结构化提取.
乳腺癌病理报告、模式匹配、正则表达式、信息抽取、自然语言处理
41
TP391;R730(计算技术、计算机技术)
解放军总医院医疗大数据中心研发项目2016MBD-018;2018MBD-005
2020-09-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
746-751