10.3969/j.issn.1003-0530.2008.01.033
基于自助法抽样分布的ROC分析
对于两类分类问题,错误率描述了分类器在单一判决阈值下的推广性能.然而,当两类错分代价不相等时,人们往往需要了解分类器在不同判决阈值下的性能.ROC(receiver operating characteristics)分析提供了一种全面了解分类器性能的途径,但是由于实际样本个数有限,训练集和测试集的划分必然会影响ROC曲线的形状,从而导致ROC分析具有不确定性.针对Fisher线性判别,本文提出了一种基于自助法抽样分布的ROC曲线生成方法.具体如下:定义Fisher线性分类器对测试样本的判别值为统计量,由自助法分别得到Fisher线性分类器对两类测试样本判别值的两个抽样分布,在这两个抽样分布范围内连续地改变阈值即可得到ROC曲线.实验表明,与随机划分和10重交叉验证相比,由本文方法生成的ROC曲线形状更加稳定,并且相应ROC曲线下面积的置信区间更短,也即本文方法能产生更加精确的ROC分析.
两类分类、自助法、抽样分布、Fisher线性判别、ROC曲线
24
TN91
浙江省自然科学基金Y104540
2008-05-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
140-143