基于多段间隔监督度量学习的病人相似度算法

引用

摘要：

伴随着医疗卫生服务的信息化进程推进,病人相似度成为了医疗电子健康数据的二次利用中的重要问题.在已有医疗专家对病人健康数据的评估信息下,可以将病人相似度问题转化为有监督的距离度量学习问题.通常的做法是对病人的医疗健康数据打标签来作为监督信息.在现有的病人相似度计算工作中,对监督信息的利用是很局限的;多是比较两个不同病人的标签是否完全相等来判断病人相似与否;在实际中,病人的标签往往是多个维度,这种比较忽略了标签本身的相似性.本文将病人的诊断数据作为监督信息,在度量学习中,根据标签的相似程度将目标病人的邻居区分开来,形成多段间隔,更充分地利用监督信息.在基于多标签的KNN分类评估实验中,该算法学习出的相似度度量在Hamming Loss和a-Accuracy两种指标下性能有很大提升.

关键词：电子健康记录、病人相似度、监督距离度量学习、多标签分类

所属期刊栏目：25

分类号：TN9;TP3

资助基金：国家自然科学基金U1435220;军队后勤科技项目AWS4R013

在线出版日期：2016-12-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：164-171

英文信息展示

期刊专题