10.3778/j.issn.1002-8331.2010.04.003
使用优化模拟退火算法的文本特征选择
在文本分类中,特征空间维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象.为了提高文本挖掘算法的运行速度,降低占用的内存空间,提出了一种基于优化的模拟退火算法的特征选择方法.在该方法中,为避免遗失当前最优解,增加了记忆功能,将当前最好的状态记忆下来,从而使得模拟退火算法成为一种智能化算法;设计了一个自适应温度更新函数,并设置双阈值使得在尽量保持最优性的前提下减少计算量,从而较快地获得较具代表性的特征子集.实验结果表明该方法是有效的.
文本分类、特征空间、特征选择、模拟退火算法
46
TP301(计算技术、计算机技术)
四川省科技计划项目the Science and Technology Plan Projects of Sichuan Province of China under Grant 2008GZ0003;四川省科技厅科技攻关项目the Torch-Plan Projects of Sichuan Province of China under Grant 07GG006-019
2010-04-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
8-11