基于蓝藻全基因组原始数据的转座元件挖掘及组成分析
二代测序技术及全基因组多样性比较是现代生物学及信息科学研究的热点,对基因组中转座元件(Transposable element)的分析已成为基因组比较分析的重要组成部分.目前对于转座元件的种类、数量和组成的挖掘和分析一般是基于完全拼接后的全基因组序列,对在此之前的海量短片段序列后期处理及拼接仍是目前基因组研究的盲点,以转座元件为主的重复序列在拼接过程中也存在着不可避免的拼接误差或丢失,给转座元件系统的分析带来不确定.文章旨在建立一套分析流程,对铜绿微囊藻NIES 843全基因组构建的罗氏(Roche)公司454测序随机模拟原始数据集的转座元件(主要类型为插入序列:Insert sequence,IS)组成进行分析,结果表明,采用对核酸探针扫描后备选序列分成3组,并分设氨基酸检测阈值的方案分析得到的结果较为可靠,结果显示铜绿微囊藻NIES843的蓝藻转座元件占基因组比例的10.38%,归属于14个IS家族,66个IS亚家族.与之前基于完整拼接基因组数据的两套不同分析流程得到的结果相比,在丰度及家族/亚家族组成上无显著差异,在转座元件序列水平上也显示了高比例的相似性序列重叠,证实了本研究流程在基于高通量测序原始数据的转座元件分析方面具可靠性及实用性.
蓝藻基因组、插入序列、IS家族、转座元件、Roche 454测序原始数据
33
S85;R37
淡水生态与生物技术国家重点实验室项目2011FB17;国家重点基础研究发展规划973计划项目2008CB418002
2011-09-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
654-660