10.3760/cma.j.issn.1673-4122.2014.06.003
基于组学的多房棘球绦虫分泌蛋白预测与分析
目的 预测多房棘球绦虫的分泌蛋白组,分析分泌蛋白及其信号肽特征,为发展多房棘球蚴病的诊断和治疗方法奠定基础. 方法 采用SignalP4.1对多房棘球绦虫全基因组蛋白序列信号肽进行预测,并依次采用生物信息学软件TMHMM v2.0、Phobius、Big-PIpredictor及TargetP1.1筛选去除假阳性的预测蛋白.随后采用Excel统计信号肽和分泌蛋白的氨基酸序列特征,SPSS19.0对分泌蛋白及非分泌蛋白的氨基酸含量进行科尔莫哥罗夫-斯米尔诺夫检验(kolmogorov-smirnov test,K-S test)和t检验.最后利用京都基因和基因组百科全书自动注释工具(KEGG Automatic Annotation Sever,KAAS)进行分泌蛋白的注释和分析. 结果 在多房棘球绦虫10~780条全基因组序列所编码的蛋白中,共发现875条含有信号肽的蛋白序列,其中307条属于膜结合蛋白;38条含糖基磷脂酰肌醇(glycosylphosphatidylinositol,GPI)锚定位点;12条定位于线粒体.最终获得了含518条序列的多房棘球绦虫分泌蛋白组.SPSS统计分泌蛋白的信号肽长度集中于11~53个氨基酸,其中疏水性氨基酸含量占61%;且分泌蛋白的氨基酸含量(38~7 809个)显著小于(t=0.203,P<0.01)非分泌蛋白氨基酸的含量(11~11 194个);KAAS分析显示获得注释的分泌蛋白主要出现在人类疾病、新陈代谢过程、环境信息处理、有机系统、细胞过程和遗传信息处理通路上,其中有6条序列已知和寄生虫感染直接相关. 结论 本研究获得了518条蛋白序列多房棘球绦虫分泌蛋白组,为后续的诊断、疫苗和药物靶点等相关研究提供了生物信息学数据.
多房棘球绦虫、分泌蛋白组、信号肽、生物信息学
41
F4;TP311.13;Q51
2015-01-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
328-333