10.3969/j.issn.2095-3097.2018.02.008
4种相关分析方法在菌群和代谢物相关研究中的初步比较
目的 组学数据信息多样且体量庞大,变量间关系错综复杂.相关分析有助于在海量数据间找到有效关联对,是转化医学和系统生物学研究中常用手段之一.元基因组学和代谢组学2大组学平台由于具备整体系统性分析的功能,广泛应用到了菌群和代谢物的相关研究中.元基因组学和代谢组学数据的来源、结构和特点各不相同,需科学选取相关分析方法进行高质量跨组学研究.方法 选取4种典型的相关分析方法(2种经典方法和2种元基因组数据专用方法),设计仿真数据集和实验数据集,对各方法的性能进行测试和比较.结果 仿真和真实数据结果显示,CCLasso的相关系数最小,误差百分比最大,所找到的相关对数目最少;SparCC的结果与CCLasso相反;Pearson与Spearman结果介于两者之间,较为中立.结论 对于元基因组学与代谢组学数据的相关分析,CCLasso方法较为严格,易得到假阴性结果;SparCC方法较为宽松,易得到假阳性结果;Pearson和Spearman结果介于两者之间.建议研究者结合研究目标和侧重点确定具体方法.
相关分析、代谢组学、元基因组学、转化医学
7
TP391.41;R574(计算技术、计算机技术)
国家自然科学基金项目31501079,31500954,81772530;上海交通大学附属第六人民医院院内预研2017
2018-05-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
93-96