DOI：10.3969/j.issn.1006-1436.2013.08.059

K-means算法在读者行为模式中的应用研究

引用

摘要：

聚类是一种常见的数据分析工具,其目的是把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同[1].事物(样本、对象或变量)归类的依据是相似度的大小. 聚类的严格数学描述如下: 被研究的样本集为E,类C定义为E的一个非空子集,即C∈E且C≠φ.聚类就是满足C1∪C2∪C3∪…∪CK=E和CinCj=φ(对任意i≠j)两个条件的类C1,C2,C3,…,CK的集合[2].从这两个条件可以看出,样本集E中的每个类必定属于且只属于一个类. 由聚类生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此地相似,与其他簇中的对象相异[1]. 基于划分的聚类算法中,K-means算法在大多数应用中被采用.

机标关键词：k-means、means算法、读者行为模式

所属期刊栏目：34

分类号：TP391;G271;TP181

资助基金：江苏省现代教育技术研究项目19809

在线出版日期：2013-11-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共2页

页码：88-89

期刊专题