10.3969/j.issn.1000.3842.2011.11.063
基于FSA的DNA重复体频率统计算法
针对现有DNA重复体频率统计算法效率低、灵活性差等不足,基于字符串多模式匹配的有限状态自动机,构造DNA子序列比对自动机,利用KMP算法对自动机进行状态转移优化,由此提出一种高效的重复体频率统计算法.该算法通过对DNA数据库的线性扫描,得到每个DNA子序列在全局数据库中重叠与非重叠的重复体频率统计信息以及指定DNA序列集合的最长公共子序列信息.实验结果表明,该算法具有效率高、匹配精确、信息获取方式灵活、支持在线操作等优势.
有限状态自动机、DNA子序列、重复体频率、频率统计算法、最长公共子序列
37
TP18(自动化基础理论)
2010年浙江省新苗人才计划基金资助项目2010R404017
2011-08-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
184-186,189