10.13413/j.cnki.jdxblxb.2022083
基于二进制蜉蝣优化的特征选择及文本聚类算法
针对文本冗余特征导致聚类精度较低的问题,提出一种基于二进制蜉蝣优化的特征选择及文本聚类算法.首先,对传统蜉蝣算法的位置更新、交配与变异策略进行改进;然后,将其与特征选择模型相结合,以逆文档频率为目标函数对文本特征进行选择;最后,在新特征子集的基础上,利用K-means++算法对文本进行聚类,得到最优文本聚类结果.在多个数据集上进行实验的结果表明,该算法能有效缩短特征维数,提高文本聚类效率.
二进制蜉蝣算法、文本聚类、收敛速度、特征选择
61
TP393(计算技术、计算机技术)
国家自然科学基金;东北石油大学引导性创新基金
2023-05-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
631-640