10.3778/j.issn.1673-9418.2006096
融合多视角和多标签学习的RNA结合蛋白识别
RNA结合蛋白(RBP)是一类伴随RNA调控代谢过程与RNA结合的蛋白质的总称.一种RBP可能存在多种靶标RNA,其表达缺陷会造成多种疾病.现有的方法大都是针对某种特定的RBP设计二分类模型,预测一条RNA是否可以与之结合.但这些方法没有考虑到不同RBP之间的结合相似性和关联性.对此,iDeepM利用多标签深度学习法进行了改进.此方法使用多标签技术和长短时记忆网络(LSTM),学习到不同RBP之间的结合相似性,预测一条给定的RNA与多种RBP的结合情况,但是该方法未能对RNA序列进行充分的特征学习和多标签学习,预测精度较低.延续iDeepM多标签的研究方法,提出新方法RRMVL,首次使用RNA序列视角、氨基酸序列视角、RNA序列语义视角和多间隙二肽成分视角组成多视角数据来处理多标签RBP识别问题.为了利用多视角数据的不同学习优势,融合四种视角提取到的深度特征,使用逻辑回归原理对它们进行多标签特征学习,将学习后的加权特征向量输入至链式多标签分类器中训练,使之达到最优多标签链式学习的效果.实验研究表明,融合多视角和多标签学习的RNA结合蛋白识别模型预测精度较之前使用单视角方法有了明显的提升.
多视角深度特征学习;多标签特征学习;最优多标签链式学习;RNA结合蛋白识别
15
TP181(自动化基础理论)
国家自然科学基金;食品科学与技术国家重点实验室开放课题;轻工业技术与工程国家一流学科计划;江苏省六大人才高峰项目;上海市"脑与类脑智能基础转化应用研究"市级重大科技专项
2021-11-17(万方平台首次上网日期,不代表论文的发表时间)
共13页
2193-2205