10.3969/j.issn.1000-1220.2012.10.030
非共现数据两阶段加权IB算法
非共现数据是指不符合联合概率分布,而是符合一个未知函数的数据.将非共现数据转化为共现形式后可以采用熵来定量度量信息并进行聚类.但是,现有算法假设非共现数据的各个属性特征对聚类贡献均匀,没有考虑代表性属性和不相关(冗余)属性对聚类效果的不同影响.因此,本文提出一个非共现数据的两阶段加权IB算法(TSAW-sIB),在非共现数据共现转化的两个阶段,从“非共现/共现/联合”三个视角观察非共现数据,突出代表性属性,抑制冗余属性,获得更能准确反映非共现数据特征的数据表示并进行聚类.实验表明,TSAW-sIB算法优于ROCK、COOLCAT和LIMBO算法.
非共现数据、特征加权、两阶段、信息瓶颈方法、聚类
33
TP18(自动化基础理论)
国家自然科学基金项目60773048,61170223
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
2278-2282