DOI：10.3969/j.issn.1673-629X.2017.11.021

一种改进的模糊数据流聚类算法

引用

摘要：

提出了一种基于TEDA(典型与偏心数据分析,Typicality and Eccentricity Data Analysis)模型的模糊数据流聚类算法.TEDA模型常用于离群数据样本的检测,以此来获得更好的聚类效果.为能够适应在线模糊数据流聚类、满足实时响应要求,该算法沿用了TEDA算法中离心率与典型性的概念及相关公式,用以判断指定数据样本是否属于特定数据簇或特定数据簇群,以此进行整个簇群的更新.同时对TEDA算法在处理高维度数据流时的不足进行补充.该算法具有完全的自主性,能够自动地创建、更新及合并数据簇,并且无需提前定义参数.不同于传统聚类算法,该算法无需存储已扫描数据样本,内存利用率高,计算成本低,并且利用递归使其更适用于在线实时应用.实验结果表明,该算法可以很好地对实际数据进行聚类分析,相对于传统算法具有一定优势.

关键词：典型与偏心数据分析、离心率、典型性、聚类

所属期刊栏目：27

分类号：TP301(计算技术、计算机技术)

资助基金：江苏省高校自然科学研究计划项目05KJD520146

在线出版日期：2017-12-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：96-100

英文信息展示

期刊专题