三种数据挖掘算法在电子病历知识发现中的比较
[目的]从异构的电子病历数据中发现疾病危险因素,为数据挖掘与知识发现提供借鉴.[方法]选取集各种结构为一身的临床电子病历数据,利用决策树、逻辑回归和神经网络三种数据挖掘算法分别建立疾病危险因素预测模型,对三种预测模型进行比较分析和统计学评价.[结果]决策树预测模型在查准率、召回率上高于逻辑回归和神经网络,在总体性能上决策树最优,但三者差别不大.[局限]未对电子病历属性进行优化选择.[结论]决策树在危险因素的发现与疾病的预测方面优于逻辑回归和神经网络.研究中建立基于数据挖掘算法的异构数据源知识发现框架,为今后领域知识发现和知识库构建以及数据挖掘算法的选择提供一定借鉴和参考.
知识发现、电子病历、数据挖掘算法、预测模型
G202(信息与传播理论)
本文系国家自然科学基金项目“嵌入式知识服务驱动下的领域多维知识库构建”项目编号:71573102和吉林大学大学生创新创业训练计划“基于数据挖掘算法的体检数据中脂肪肝危险因素相关性研究”项目编号:2015721054的研究成果之一.
2016-08-10(万方平台首次上网日期,不代表论文的发表时间)
102-109