DOI：10.3969/j.issn.1000-3428.2008.16.077

基于随机游走模型和KL-divergence的聚类算法

引用

摘要：

聚类分析在数据挖掘领域有着广泛的应用,该文提出一个聚类新思路,它不需要任何参数的假设,只基于数据两两之间的相似性.该方法假设数据点之间存在随机游走关系,根据数据相似性构造随机游走过程的转移矩阵,当随机游走过程进入收敛期后,t阶转移矩阵揭示了数据点的分布.用迭代方法寻找最小的KL-divergence来对这些分布聚类.该方法具有严谨的概率理论基础,避免了传统算法需要参数假设、限于局部最优等不足.实验表明,该算法具有较优的聚类效果.

关键词：聚类、随机游走、KL散度

所属期刊栏目：34

分类号：TP301.6(计算技术、计算机技术)

在线出版日期：2008-09-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：224-226

英文信息展示

期刊专题