10.3321/j.issn:1000-6737.2000.04.016
遗传密码和DNA序列的高维空间数字编码
二进制数字化编码是信息科学最基本的编码方式.用0(00)、1(01)、2(10)和3(11)4个数码对4种碱基(C、T、A、G)进行二进制数字编码,共有24种可能的编码组合,其中8种满足碱基互补法则,它们是拓扑等价的.按碱基分子量大小排列的编码格式:0123/CTAG是最理想的编码格式.用二进制数对DNA的字符序列进行编码,有以下优点: 1)压缩信息冗余度,提高编码效率;2)可以对碱基的结构、功能基团、碱基互补、氢键强弱等性质进行编码; 3)DNA序列的数字编码具有严格的大小顺序,即具有全序性质; 4)DNA数字编码的对称性程度,与遗传密码简并度的对称性一致,并可得出氨基酸遗传密码的高维空间连通性简并法则; 5)可以方便求出任意碱基重复单元的重复系列的数字编码法则; 6)根据高维空间汉明编码距离的定义,可以确定任意多个DNA序列之间的信息距离和它们的交空间和并空间,对DNA序列生物信息学的分析研究有重要意义;7)DNA序列的数字编码可以方便进行各种数学运算和逻辑运算,对促进DNA生物计算机的发展,可有重大推动作用.
数字编码、DNA序列、遗传密码、高维空间、汉明距离、生物计算机
16
Q617(理论生物物理学)
中国科学院资助项目
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
760-768