RNA全序列特征可视化提取方法
一种RNA全序列特征可视化提取方法,主要包括数据预处理、规则选取、元胞自动机CA方法应用及序列图像生成,首先对得到的RNA序列中每个脱氧核糖核酸“A”“T”“G”“U”进行编码,引入一维元胞自动机模型,选用特定的元胞自动机规则对编码后的“0”“1”基因序列进行演化,即元胞的下一时刻的状态由元胞和它的左右两个相邻元胞当前时刻的状态按照演化规则来决定,经若干次演化后形成一个“0”“1”二维矩阵,将二维矩阵转化为黑白图像并进行缩放,得到具有RNA全序列特征可视化图形。本发明方法具有全序列分析,直观性,敏感性和普适性的特点,从生成的可视化序列图像中可得到不同基因序列具有的特征。
发明专利
CN200410025035.7
2004-06-10
CN1584027
2005-02-23
C12N15/10
上海交通大学
王猛;黄振德;杨杰;刘国平;徐志节;姚莉秀
200240上海市闵行区东川路800号
上海交达专利事务所
毛翠莹
上海;31
1、一种RNA全序列特征可视化提取方法,其特征在于包括如下具体步骤:1)首先对得到的RNA序列中每个脱氧核糖核酸“A“”T“”G“”U”进行编码,将RNA序列转换为“0”“1”序列,具体为:A=00U=01G=10T=11,并在序列的两端各补上一个0;2)在元胞自动机CA法三点定一点的规则中选定一条区分性最好的规则作为演化规则;3)在基因序列中引入一维元胞自动机模型,在这一模型中,所有的元胞分布在一维直线上,按照选定的元胞自动机规则对编码后的“0”“1”基因序列演化,即元胞的下一时刻的状态由元胞和它的左右两个相邻元胞当前时刻的状态按照演化规则来决定,将已编码的原始基因序列作为第一行,把对第一行进行演化的结果作为第二行,把对第二行进行演化的结果作为第三行,依次类推,每次演化后的新序列在其序列两端各补上一个0,经过若干次的演化后,形成一个“0”“1”二维矩阵;4)定义“0”“1”二维矩阵中“0”表示黑色,“1”表示白色,使用可视化技术,将二维矩阵转化为一个黑白相间的二值图像,并对图像进行水平和垂直方向变换缩小,得到具有RNA全序列特征的可视化图形。