10.3969/j.issn.1000-2006.201806029
一款基于转录组差异基因表达分析的软件包——findDEG
[目的]随着二代测序技术的不断发展,转录组测序技术在许多物种里已被广泛地应用于基因差异表达分析和基因注释研究.现有的多种基因差异表达分析软件,分析步骤多而且复杂,不同分析方法其结果差别也较大,这给研究者分析实际数据带来了不少困难.为了简化基因差异表达分析的过程,利用现有的软件开发一个集成的软件包.[方法]针对Trinity、TopHat+Cufflinks和HISAT2+StringTie 3种比较成熟的基因差异表达分析流程,考虑研究对象有无参考基因组序列、样本数据是否有重复、单端还是双端测序、不同基因表达量的计算方法以及不同的基因差异表达显著性检验方法等因素,将多种转录组测序数据分析软件整合起来形成一个集成的软件包.[结果]使用Perl语言开发了一个名为findDEG软件包用于转录组测序数据的基因差异表达分析.软件包共分为3个模块,即Trinity、TopHat+Cufflinks和HISAT2+StringTie模块.Trinity模块提供3种计算转录本表达量方法和4种差异表达基因显著性检验方法,TopHat+Cufflinks模块可供用户选择新版或旧版的Cufflinks分析方案,HISAT2+StringTie模块则只有一种分析方案.该软件包可以自由下载使用,其网址为http://www.bioseqdata.com/findDEG/findDEG.htm.采用新版和旧版的Cufflinks分析方案以及一种Trinity组合方法,分别对小叶杨在正常和干旱胁迫条件下的转录组数据进行了分析.结果 两种Cufflinks方法分别识别出了53和33个差异表达基因,其中25个是相同的;Trinity方法识别了高达1 641个差异表达基因,其中与Cufflinks两种方法相同的分别有14和3个.[结论]新开发的软件包findDEG有十多种基因差异表达分析方案可供选择,采用一键的方式进行数据计算分析,避免了中间环节参数输入和结果利用等操作步骤,使用方便.
基因差异表达分析、Perl语言、杨树、转录本、转录组测序、findDEG
43
Q811.4(生物工程学(生物技术))
国家自然科学基金;国家自然科学基金;江苏高校优势学科建设工程项目
2019-07-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
93-99