10.3969/j.issn.0258-8021.2013.02.001
蛋白质数据库对蛋白质组鉴定的影响
在蛋白质组学研究中,通常使用数据库检索算法进行蛋白质的鉴定.使用完整性较高但注释不准确的数据库,可能能够鉴定到更多的蛋白质,但存在数据不准确的风险;使用注释准确但完整性较低的数据库,则有可能漏掉一些数据库中未收录的蛋白.如何兼顾蛋白质鉴定结果的完整性和准确性是一个重要的问题.本研究以人类蛋白质组为例,采用不同质谱仪及不同样品产生的蛋白质组数据,比较了常用的IPI数据库、UniProt数据库和Swiss-Prot数据库的检索结果.结果表明,3个数据库在不同的蛋白质组数据中表现各有优劣,但总体来讲差异很小;每个数据库可鉴定到的、特有的多肽数不超过总数的5%,蛋白数的差异为1%~5%.说明3个数据库都覆盖了常见的人类蛋白序列,完整性很高.因此,推荐采用通过人工注释、在不断更新中的Swiss-Prot数据库作为检索对象.当研究目的为鉴定或定量未收录在Swiss-Prot数据库中的蛋白序列(如一些特殊的蛋白异构体或突变体)时,可将目的序列加入该数据库进行检索,或考虑使用其他完整性更高的数据库.
蛋白质数据库、蛋白质组学、数据库检索
32
R318(医用一般科学)
国家自然科学基金青年基金项目31200614
2013-08-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
129-134