10.16208/j.issn1000-7024.2022.02.024
基于和声搜索机制的特征选择与文本聚类分析
针对文本信息特征冗余多、噪声大问题,提出基于和声搜索机制的文本特征选择算法.以词频逆文本频率指数为目标函数评估特征词条;在初始文档集中通过和声搜索的记忆考虑、纵向倾角调整和随机选择3种特征选择新解更新规则,迭代搜索最优特征子集;以最优特征子集为基础,以K均值进行文本聚类.利用4种典型文档数据集进行仿真实验,实验结果表明,该算法可以有效降低文本特征维度,聚类准确率更高.
特征选择;文本聚类;和声搜索机制;K均值文本聚类;特征子集
43
TP393(计算技术、计算机技术)
山东省高等学校青创人才引育计划建设团队基金项目201901
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
472-478