10.3969/j.issn.1000-3428.2015.09.010
基于改进k-medoids算法的XML文档聚类
XML文档由于其自身的可扩展性、半结构化和自描述性等特点,已成为数据表示和交换的数据格式标准.一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间,提高数据查询的效率,挖掘出潜在的信息价值.为此,提出一种改进的k-medoids算法对XML文档进行聚类.运用模糊聚类方法确定聚类个数,利用遗传算法的全局最优的搜索能力求解最佳聚类中心点或质心,从而提高大规模XML文档集的聚类质量.实验结果表明,与基于传统k-medoids算法的聚类方法相比,改进的聚类方法具有较高的聚类准确性和收敛度.
XML文档聚类、遗传算法、模糊聚类、k-medoids聚类、聚类个数、聚类中心
41
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61303004;国家社会科学基金资助重大项目13&ZD148;福建省自然科学基金资助项目2013J05099
2015-11-06(万方平台首次上网日期,不代表论文的发表时间)
共7页
56-62