10.3969/j.issn.1006-9348.2019.10.073
基于深度学习和字符嵌入的细胞穿透肽预测
针对传统细胞穿透肽的预测方法严重依赖于繁琐的特征抽取和特征重建步骤、算法复杂且准确度不高等问题,提出了一种利用自然语言处理中的字符嵌入方法结合CNN-LSTM组合机器学习框架来预测细胞穿透肽的方法.方法 采用字符嵌入将氨基酸的代表字符通过网络学习映射到紧凑表示的向量空间中,每种氨基酸字符对应一个紧凑表示的向量,然后将肽序列通过由训练得到的嵌入向量转化为数值矩阵作为CNN-LSTM模型的输入,模型自行抽取特征后自动对输入序列的细胞穿透性进行预测.实验结果显示,在相同数据集进行实验时,研究的方法在测试集上的AUC (the area under ROC curve)值达到0.97,正确指数达到0.846,优于其它方法,说明上述方法能够简单、高效地进行细胞穿透肽的预测.
深度学习、字符嵌入、细胞穿透肽、预测
36
TP391(计算技术、计算机技术)
国家自然科学基金项目61602280,61473179;山东省自然科学基金项目ZR2014FQ028
2019-11-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
353-358