10.3979/j.issn.1673-825X.2012.06.025
利用文本数据挖掘研究p53基因表达调控网络
为了研究p53基因与其下游/靶基因的关联性,以了解p53基因表达调控网络,采用文本数据挖取方法,利用自编的Perl 5.10程序,对PubMed文献数据库中p53基因相关文献及人类基因本体数据库进行数据挖掘,并利用连锁聚类法构建p53基因表达调控网络图.结果发现,目标基因的频率分布同文本中所有基因本体的频率分布存在一定的关联性,低频基因的文本挖掘比例明显低于高频基因的文本挖掘比例.从而说明,p53基因表达调控网络中各基因的分布情况与基因频率有较大关系,而文本数据量对文本数据挖掘的准确率也有重要影响.
文本数据挖掘、p53基因、基因本体、连锁聚类分析
24
Q354
重庆市自然科学基金CSTC,2009BB5419;重庆邮电大学博士启动基金A2007-40,A2009-63
2016-01-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
798-803