10.3969/j.issn.1672-9870.2015.05.026
基于Hash算法的DNA序列k-mer index问题的数学建模
针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题.最后在硬件平台CPU为2.6GHz、内存为8G、操作系统为64位Windows 7的条件下,对100万条长度为100的DNA序列进行了测试,给出了不同k值下建立和查询索引的用时和占用内存情况,有效的解决了DNA序列的k-mer index问题.
Hash算法、索引问题、数学模型、复杂度分析
38
O244(计算数学)
国家自然科学基金NSFC:11326078
2015-12-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
116-119