10.3778/j.issn.1673-9418.2104019
最近邻的密度峰值聚类标签传播算法
基于动态图的密度峰值聚类标签传播算法(DPC-DLP)是密度峰值聚类算法(DPC)的一种改进算法,该算法涉及的相关参数过于复杂,并且算法在每次迭代时都会使用标签数据,会出现标签错误扩大化现象,存在迭代次数过多导致聚类效果恶化等问题.针对上述问题,提出了一种最近邻的密度峰值聚类标签传播算法(DPC-NLP).该算法主要有三个步骤:首先利用局部密度和最小距离对样本点进行打分,根据分数确定聚类中心,然后使用聚类中心的标签在其最近邻内形成簇骨干,最后使用最近邻的标签传播方法将簇骨干的标签传播到剩余样本上,并形成最终的聚类结果.最近邻标签传播算法充分考虑数据间的结构关联性情况,并在传播的过程中不断更新数据的状态,利用更充分的信息提高分配正确率.在人工和真实数据集上对算法进行验证,并与目前主流的聚类算法进行比较,实验结果表明,DPC-NLP在性能和鲁棒性方面表现优越,并可以处理流形和非线性等复杂数据.
聚类、密度峰值聚类、标签传播、最近邻
16
TP181(自动化基础理论)
国家自然科学基金;江苏高校优势学科建设工程资助项目
2022-12-22(万方平台首次上网日期,不代表论文的发表时间)
共11页
2809-2819