10.3969/j.issn.1000-1220.2018.04.020
结合高斯混合模型的关联分类离散化算法研究
大多数以规则为基础的分类不能直接处理像血压这一类连续数据.离散化数据预处理可以将连续的数据转变成分类格式.现有的离散化算法没有考虑到数据集中连续变量的多模态分类密度,这可能会降低以规则为基础的分类器性能.提出一种新的基于高斯混合模型的离散化算法(Discretization Algorithm based on Gaussian Mixture Model,DAGMM),通过考虑连续变量的多峰分布以保留数据的原始模式.DAGMM算法的有效性通过4个公开可用的医疗数据集进行验证.实验结果表明,在产生的规则数和关联分类算法的分类准确度方面,DAGMM算法优于其它6个静态离散化算法.因此,在临床专家系统中运用此方法,有潜力提高以规则为基础的分类器的性能.
离散化、关联分类算法、规则归纳算法、高斯混合模型
39
TP391(计算技术、计算机技术)
国家自然科学基金项目61163010;甘肃省自然科学基金项目1308RJZA111
2018-04-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
732-737