10.3864/j.issn.0578-1752.2018.18.015
基于比较基因组学分析的方法定位及注释双峰驼MHC基因
[目的]定位并注释双峰驼主要组织相容性复合体(major histocompatibility complex,MHC)基因序列,为进一步研究双峰驼MHC基因提供科学依据.[方法]运用比较基因组学方法,提取人类MHC (HLA)基因编码序列和牛MHC (BoLA)基因编码序列并分别与双峰驼转录本进行blastn基因序列比对,识别出相似度较高的scaffolds,通过分析HLA、BoLA基因序列比对在这些scaffolds上的位置顺序,对多条scaffolds进行拼接,得到双峰驼MHC的Pseudo chromosome;再分别提取HLA、BoLA全基因组序列与双峰驼已拼接的scaffolds进行基因组共线性分析,利用lastz建立起的Pseudo chromosome与HLA、BoLA全基因组序列的线性关系判断筛选出的scaffolds是否准确;然后通过分析MHC基因在两物种间的线性关系,在双峰驼参考基因组中提取出MHC基因序列,并对这些序列进行基因注释;最后根据得到的双峰驼MHC基因绘制系统进化树,研究其基因间的进化关系.[结果]通过对HLA、BoLA基因编码序列与双峰驼转录本用blastn进行序列比对,识别出了相似度较高的3条scaffolds,即NW_011511766.1(全长4.1M)、NW-011515227.1(全长1.2M)和NW_011514613.1(全长15K),对其拼接得到双峰驼MHC的Pseudo chromosome;利用lastz共线性分析,识别出HLA基因序列和BoLA基因序列并比对出其在双峰驼MHC基因的共线性区域.该区域与拼接得到的Pseudo chromosome一致,证明筛选出的scaffolds是准确的.并且发现Class-Ⅰ类和Class-Ⅲ类基因集中分布在NW_011515227.1上,而C1ass-Ⅱ类基因集中分布在NW_011511766.1和NW_011514613.1上,进一步分析得知Class-Ⅱ类基因主要分布在NW_011511766.1的3.5-4.1M的位置;将存在共线性区域的序列提取出来,与比对到双峰驼上的MHC基因的编码序列进行blat分析,结果在双峰驼基因组中共识别出24个与牛BoLA基因高度相似的基因,其中Ⅰ类基因1个,Ⅱ类1 0个,Ⅲ类基因1 3个.对双峰驼这24个MHC基因进行信息注释并绘制系统进化树,结果显示注释的Class-Ⅰ类和Class-Ⅱ类基因在同一分支.[结论]通过比较基因组学方法定位并注释了双峰驼的MHC基因,将双峰驼MHC基因序列定位到了3条scaffolds上,找到并注释了24个MHC基因,绘制了双峰驼MHC的Pseudo chromosome,为进一步研究双峰驼MHC基因奠定了理论基础.
双峰驼、MHC、CBLA、BoLA、HLA、比较基因组学
51
国家自然科学基金31360591
2018-10-31(万方平台首次上网日期,不代表论文的发表时间)
共9页
3591-3599