10.3321/j.issn:1001-0505.2006.06.011
基于主成分分析及匹配聚类分析的数据表语义压缩方法
提出一种基于主成分分析及匹配聚类分析的数据表语义压缩方法PCA-Clustering.主成分分析利用属性间相关性,提取主成分以实现纵向压缩;匹配聚类通过对匹配程度的量度决定元组的隶属,用较少的簇集代表元组代替所有元组以实现横向压缩,并充分利用较小的允许误差取得更好的压缩比.仿真实验结果表明,在数据属性间线性相关关系明显的情况下,PCA-Clustering在压缩比方面平均优于Fascicles和ItCompress 10%~15%左右;与采用CaRT模型的SPARTAN相比,由于CaRT对于线性相关明显的数值型属性效果不够理想,PCA-Clustering仍然具有较好的压缩比.
语义压缩、主成分分析、匹配程度
36
TP311.13(计算技术、计算机技术)
国家自然科学基金90412014;东南大学校科研和教改项目XJ0409150
2007-01-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
927-930