10.3969/j.issn.1000-0135.2008.02.002
急性白血病相关基因的文本挖掘分析
从PubMed检索1966年到2005年9月6日间白血病与基因关系的相关文献3 529篇.经编程处理生成主题词词篇矩阵并进行聚类.通过聚类树图可将所提取的主题词/副主题词分成13类,经对比原始文献进行验证,全部29种基因中只与ALL相关的有3种, 占10.34%;只与AML相关的有8种,占27.59%.特异的可用于鉴别ALL和AML的基因有11种,占37.93%.通过主题词的共现关系进行聚类可以基本实现发现基因与疾病之间的联系,但该方法所获得的相关基因较少,不利于对疾病与基因关系的全面了解.
白血病、基因、文本挖掘、聚类分析
27
G35(情报学、情报工作)
国家自然科学基金70473101
2008-05-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
169-174