细胞穿膜肽识别问题的多特征融合卷积网络预测算法
细胞穿膜肽是一类特殊的多肽,具有独特的医学价值,因此如何通过计算方法高效地识别细胞穿膜肽是一个值得研究的重要问题.目前的主流方法是使用各种特征表示算法获取序列特征,然后使用机器学习分类器进行分类.提出了一种新的识别算法ConvCPP,利用改进的卷积神经网络提取蛋白质序列特征.改进之处包括在卷积层之前添加注意力层,并且优化了池化层的池化方式.设计消融实验来验证改进的有效性,之后结合多种其他基于蛋白质序列特征的特征提取算法,并测试了两种特征选择算法,最终得到最优的向量表示.再根据得到的向量表示,结合多种机器学习分类器对蛋白质序列进行分类识别.在基准数据集上的实验表明,该算法比当前的细胞穿膜肽识别方法具有更好的预测性能.
注意力机制、计算机应用技术、卷积神经网络、细胞穿膜肽、机器学习
51
TP399(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;吉林省中青年科技创新创业卓越人才团队项目;吉林省大数据智能计算实验室
2022-07-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
493-499