10.3969/j.issn.1006-1436.2013.08.059
K-means算法在读者行为模式中的应用研究
聚类是一种常见的数据分析工具,其目的是把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同[1].事物(样本、对象或变量)归类的依据是相似度的大小.
聚类的严格数学描述如下:
被研究的样本集为E,类C定义为E的一个非空子集,即C∈E且C≠φ.聚类就是满足C1∪C2∪C3∪…∪CK=E和CinCj=φ(对任意i≠j)两个条件的类C1,C2,C3,…,CK的集合[2].从这两个条件可以看出,样本集E中的每个类必定属于且只属于一个类.
由聚类生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此地相似,与其他簇中的对象相异[1].
基于划分的聚类算法中,K-means算法在大多数应用中被采用.
k-means、means算法、读者行为模式
34
TP391;G271;TP181
江苏省现代教育技术研究项目19809
2013-11-21(万方平台首次上网日期,不代表论文的发表时间)
共2页
88-89