10.13880/j.cnki.65-1174/n.2018.05.017
基于新改进的SVM不平衡数据集分类算法
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新改进的SVM(IMSVM)不平衡数据集分类算法.该算法先计算每个样本在距离临界区域内的密度值,依据样本的密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;再用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化.人工数据集和UCI数据集的实验结果表明:与WSVM、ALSMOTE-SVM和基本SVM算法相比,对于不平衡性较高的Spectf Heart数据集;本文算法较其他算法的G-mean提高了5.59%,F-measure提高了6.43%,CPU运行时间降低了13%.上述结果表明:IMSVM算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.
支持向量机、不平衡数据集、样本密度、分布不均匀、边界区域
36
TP391(计算技术、计算机技术)
国家自然科学基金61763029;甘肃省高等学校科研2015B-132;兰州文理学院校级种子基金自然17XJZZ06项目
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
637-643