基于深度优先判定聚类的DNA序列模体发现
提出一种数据挖掘方法MMHC来求解DNA序列模体.首先使用基于种子的错配聚类形成候选模体类,然后使用基于相对熵及聚类复杂度的深度优先判定(depth first determination,DFD)算法识别真正的模体类,最后使用保守区扫描法(conservation region scanning,CRS)及最大后验概率保值过滤法(MAP value-preservation filtering,MVPF)优化模体类.在两类DNA序列数据集上,将MMHC与三种经典的模体发现方法MEME、AlignACE和SOMBRERO进行了对比试验.结果表明:对于大多数数据集,MMHC方法无论是在发现模体的可靠性及准确性方面,还是在反映背景种类的聚类结构方面,都明显优于三种经典的模体发现方法.
模体发现、聚类分析、深度优先判定、保守区扫描
29
TP391.04(计算技术、计算机技术)
a grant of the Education Foundation of Sichuan12ZB070;四川省教育厅自然科学研究项目12ZB070
2013-09-12(万方平台首次上网日期,不代表论文的发表时间)
共11页
384-394