10.19678/j.issn.1000-3428.0050777
基于流形正则化极限学习机的文本分类算法研究
基于极限学习机的文本分类方法在对输入的文本特征进行随机映射时,会呈现一种非线性的几何结构,利用最小二乘法无法对其进行求解,影响文本的分类性能.为此,引入一种新的流形正则化思想,提出基于极限学习机的改进算法.利用拉普拉斯特征映射保持输入文本特征的几何结构.基于样本的类别信息对样本点之间的距离进行修正,优先选择类别相同的样本点,以改善分类性能.在Reuters和20newsgroup数据集上的实验结果表明,与正则化极限学习机算法、AdaBELM算法等相比,该算法分类性能较好,F1-measure值可达91.42%.
文本分类、监督学习、正则化极限学习机、流形正则化、特征映射
45
TP393(计算技术、计算机技术)
国家自然科学基金61375059,61672065
2019-07-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
242-248