10.19343/j.cnki.11-1302/c.2019.03.011
高维大数据基因网络中的社区发现——以NC方法为例
从大量基因中识别出致病基因是大数据下十分重要的高维统计问题.基因间网络结构的存在使得对于致病基因的识别从单个基因识别扩展到基因模块识别.从基因网络中挖掘出基因模块就是所谓的社区发现(或节点聚类)问题.绝大多数社区发现方法仅利用网络结构信息,而忽略节点本身的信息.Newman和Clauset于2016年提出了一个将二者有机结合的基于统计推断的社区发现方法(简称为NC方法).本文以NC方法为案例,介绍统计方法在实际基因网络中的应用和取得的成果,并从统计学角度提出了改进措施.通过对NC方法的分析可以看出,对于以基因网络为代表的非结构化数据,统计思想和原理在数据分析中仍然处于核心地位,但相应的统计方法则需要针对数据的特点及关心的问题进行相应的调整和优化.
基因网络、社区发现、元数据
36
C81(统计方法)
中国人民大学科学研究基金中央高校基本科研业务费专项资金资助项目“生物医学大学的统计方法基础研究”15XNI011
2019-05-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
124-128