10.16208/j.issn1000-7024.2021.09.017
基于二进制灰狼优化的特征选择及文本聚类
提出基于二进制灰狼优化的特征选择与文本聚类算法.为得到最佳聚类结果,将文本数据表达为矢量空间模型;利用二进制灰狼优化算法对文本特征进行选择,得到初选特征子集;对前一阶段中不同特征相关分值计算方法得到的初选特征子集进行合并与交叉操作,进一步计算最优特征子集;在新特征子集基础上,利用同步考虑余弦相似度和欧氏距离指标的多目标优化K均值算法完成文本聚类,得到最优文本聚类解.实验结果表明,在多数数据集上,该算法可以有效降低特征维度,聚类指标表现更好.
文本聚类、二进制灰狼算法、K均值聚类、特征选择、选择合并、词条权重
42
TP393(计算技术、计算机技术)
国家自然科学基金项目;江苏省自然科学基金项目
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共10页
2526-2535