混合蛙跳算法在文本分类特征选择优化中的应用
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

混合蛙跳算法在文本分类特征选择优化中的应用

引用
[目的]由于文本数据存在许多与分类不相关的冗余词项,引入混合蛙跳算法进行特征选择优化,提高分类准确率.[方法]分别使用CHI和IG预选出不同维度的特征集合,再引入改进后的混合蛙跳算法对预选特征集合进行二次优选,每只青蛙的位置代表一种特征选择规则,将分类准确率作为算法的适应度函数.SVM和KNN分类器用于实验中分类准确率的计算.[结果]引入改进后的蛙跳算法比CHI和IG能得到更好的分类效果,最大提升幅度达到12%.[局限]在少部分特征维度下出现过拟合现象.[结论]采用特征词预选和改进后的蛙跳算法相结合的特征选择优化方法可以有效排除部分噪声特征项的干扰,从而提高文本分类准确率.

特征选择、文本分类、混合蛙跳算法

TP391(计算技术、计算机技术)

本文系国家自然科学基金项目“面向文本分类的多学科协同建模理论与实验研究”项目编号:71373291和广东省科技计划项目“面向主题的中文语料库构建方法与技术”项目编号:2015A030401037的研究成果之一.

2017-03-23(万方平台首次上网日期,不代表论文的发表时间)

91-101

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

2096-3467

10-1478/G2

2017,(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn