10.11896/j.issn.1002-137X.2019.06.009
面向序数回归的组合特征提取方法
序数回归(也称序数分类)是一种监督学习任务,即使用具有自然顺序的标签对数据项进行分类.序数回归与诸多实际问题密切相关,近几年关于序数回归的研究受到越来越多的关注.序数回归与其他监督学习任务(分类、回归等)一样,需要通过特征提取来提高模型的效率和准确性.虽然特征提取被广泛研究并用于分类学习任务中,但是在序数回归中的研究较少.众所周知,相比单特征,组合特征可以表达更多的数据底层语义,但是加入一般的组合特征很难提高模型的准确性.文中基于频繁模式挖掘,借助K-L散度值来选取最有区分能力的频繁模式进行特征组合,提出了一种新的序数回归组合特征提取方法,并在公开数据集和自有数据集上使用多个序数回归模型进行实验.结果表明,使用最有区分能力的频繁模式组合特征,能够有效提升大多数序数回归模型的训练效果.
序数回归、频繁模式、特征组合、特征选择
46
TP391(计算技术、计算机技术)
国家自然科学基金61472229,61702306,61602278,61602279;山东省科技发展项目2016ZDJS02A11,ZR2017BF015,ZR2017MF027;山东省泰山学者攀登计划专项和山东科技大学科研创新团队支持计划项目基金2015TDJH102
2019-07-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
69-74