一种用于蛋白质结构聚类的聚类中心选择算法
提出一种对蛋白质结构聚类中心进行选择的算法.聚类是蛋白质结构预测过程中必不可少的一个后处理步骤,而目前在蛋白质结构预测中常用的属性阈值(Quality threshold,QT)聚类算法依赖于由经验得出的聚类半径;其他聚类算法,如近邻传播(Affinity propagation,AP)聚类算法也存在影响聚类分布的参数.为克服对主观经验参数的依赖,本文提出一种聚类中心选择算法(Exemplar selection algorithm,ESA),用于对不同参数下的聚类结果进行分析,从而选择最佳聚类中心,进而确定聚类半径等经验参数.该算法在真实蛋白质结构数据集上进行了实验,在未知经验参数情况下选择出最佳聚类中心同时也为不同聚类算法寻找适合相应数据集的客观聚类参数提供了支持.
蛋白质结构、聚类、属性阈值、近邻传播、聚类中心选择
37
TP273(自动化技术及设备)
国家自然科学基金60970055
2011-09-30(万方平台首次上网日期,不代表论文的发表时间)
682-692