密度峰值优化初始中心的K-medoids聚类算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3778/j.issn.1673-9418.1506072

密度峰值优化初始中心的K-medoids聚类算法

引用
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法.算法采用样本xi的t最近邻距离之和倒数度量其局部密度ρi,并定义样本xi的新距离δi,构造样本距离相对于样本密度的决策图.局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本.选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数.为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数.在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性.

聚类、K-medoids算法、初始聚类中心、密度峰值、准则函数

10

TP181.1(自动化基础理论)

The National Natural Science Foundation of China under Grant No.31372250;the Key Science and Technology Program of Shaanxi Province under Grant No.2013K12-03-24;the Fundamental Research Funds for the Central Universities of China under Grant No.GK201503067

2016-06-07(万方平台首次上网日期,不代表论文的发表时间)

共18页

230-247

相关文献
评论
暂无封面信息
查看本期封面目录

计算机科学与探索

1673-9418

11-5602/TP

10

2016,10(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn