10.3969/j.issn.1672-5565.2010.02.012
基于SAS的多元统计方法实现芯片数据挖掘
利用SAS软件对GEO的一个肺癌芯片实验进行挖掘.采用非参数检验,判别分析和回归分析对该芯片实验中14个核受体的表达信息进行分析.结果表明,在0.05显著性水平下,ER1、VDR、 RARα和 RORα四个基因在腺癌和鳞癌表达具有统计学差异;RARβ在复发组和非复发组表达有差异.判别分析结果显示VDR和RORα表达量可以对病理类型进行预测,但是总误判率很高(0.238 9);RARβ和PPARα对判别是否复发的总误判率更高(0.345 7).建立回归方程预测病理类型,入选模型的变量也是VDR和RORα,两者OR分别为0.126和4.452.可见,基于SAS的多元统计方法是芯片数据挖掘的一种潜在方法,一旦芯片实验标准化,利用SAS对不同芯片实验数据整合分析的结论将有益于推动假说形成.
数据挖掘、芯片、SAS
8
Q786(基因工程(遗传工程))
北京市教委科研基金资助2005年度
2010-07-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
147-149