基于多示例多标记迁移学习的蛋白质功能预测
随着各种基因组测序计划的推出,不断有很多物种被新测序完成,需要对这些物种的蛋白质功能进行注释.这些物种中已知功能的蛋白质数量少,可以考虑使用亲缘关系近、已知功能蛋白质数量多的物种来帮助这些物种进行蛋白质功能预测.本文把这个任务抽象为多示例多标记迁移学习问题,并提出了第一个多示例多标记迁移学习框架TR-MIML来解决此任务.TR-MIML通过最小化投影空间上加权源域样本中心点与目标域样本中心点的距离,给源域样本赋予不同权值,并基于目标域和源域样本训练多示例多标记学习模型.在两个新完成测序物种上,实验结果证明了迁移学习有助于它们的蛋白质功能预测.另外,亲缘关系越近的物种作为源域进行迁移学习帮助越大.
新测序物种、蛋白质功能预测、迁移学习、多示例多标记学习、样本加权
47
TP301.6;TP181;S663.1
国家自然科学基金;国家自然科学基金;国家重点基础研究发展计划(973计划);江苏省高等学校自然科学研究重大项目;江苏省重点研发计划;南京信息工程大学PAPD与CICA-EET资助项目
2018-01-09(万方平台首次上网日期,不代表论文的发表时间)
共13页
1538-1550