基于相关熵的快速聚类算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.7652/xjtuxb202106015

基于相关熵的快速聚类算法

引用
针对目前大规模真实数据聚类中存在的效率低和鲁棒性差的问题,提出了一种基于相关熵的快速聚类算法(FCC).该算法主要分为以下两步:首先对原始数据进行k均值操作,得到粗略的样本类别,作为第二步的标签矩阵;其次利用原始数据与其锚点构建的锚点图对应的拉普拉斯矩阵作为图约束来探寻数据间的内在结构,从而得到样本的最终类别.整个聚类过程在相关熵准则而不是传统的欧氏距离框架下进行,可有效抑制真实数据中大量存在的非线性和非高斯分布的噪声对聚类鲁棒性的影响.为了验证提出算法的性能,使用5种典型的算法作为对比算法与提出的算法一起在4个大规模真实数据集上运行,结果表明,提出的算法可在大部分情况下提高聚类精度,在WebKB、TDT2和Cora数据集上分别提高8.58%,6.86% 和1.86%,同时提高聚类效率几倍甚至几十倍;为了验证本算法的鲁棒性,分别加入不同程度的随机噪声和泊松噪声到WebKB和Cora上,得到8个含噪数据集,所有算法均在相同条件下运行于这些噪声数据集上,结果表明,相对于其他对比算法,提出的算法能够保持最优的聚类鲁棒性.

快速聚类、相关熵、锚点图

55

TP181(自动化基础理论)

国家重大科技攻关资助项目;大学基础研究基金

2021-06-21(万方平台首次上网日期,不代表论文的发表时间)

共10页

121-130

相关文献
评论
暂无封面信息
查看本期封面目录

西安交通大学学报

0253-987X

61-1069/T

55

2021,55(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn