10.3969/j.issn.1002-137X.2008.09.042
一种有效的不完整数据分类器
在模式识别、机器学习以及数据挖掘中,分类是一个基本而又重要的问题.虽有大量的分类器应运而生,但由于处理不完整数据的复杂性,它们大都是针对完整数据的.然而,由于各种原因,现实中的数据通常是不完整的.因此,对不完整数据分类器的研究具有重要意义.通过分析以往在分类过程中对不完整数据的处理方法,提出了一种不完整数据分类器:DBCI.在DBCI的训练过程中,将缺失值的频数按比例地分配到其它观测值的频数中.因此,不完整数据集所包含的信息可以得到充分利用.在12个标准的不完整数据集上的实验结果表明,与分类效果显著的不完整数据分类器RBC相比,DBCI具有更高的分类效率和更稳定的性能,并且它的分类准确率可以与RBC相媲美.
分类、贝叶斯方法、不完整数据
35
TP3;TP1
国家自然科学基金60503017和60673089
2008-11-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
162-164