10.3969/j.issn.1673-629X.2013.12.001
超长DNA序列的高效压缩算法研究
DNA序列虽然只由四个碱基组成,但数据量却非常巨大。有效的压缩DNA数据能大量节省传输的时间开销。目前已经有一些DNA序列专用的压缩算法,如Biocompress,DNACompress和CTW+LZ。虽然这些算法可以获得较好的压缩比,但是由于采用了传统的CTW算法或LZ系列的字典替换,导致花费太多的时间。为了解决这一问题,提出使用改进的RLE,差分编码和可变长整形等一系列编码方式进行多重压缩的高效压缩算法Dzip。标准DNA Benchmark数据测试的实验数据表明,该算法与现行DNA专用压缩算法相比,加速比至少为28。
双序列比对、DNA数据压缩、可编程门阵列、差分编码、可变长整形
TP301.6(计算技术、计算机技术)
国家“863”高技术发展计划项目2003AA001018;航空科学基金02F53031
2013-12-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
1-4,10