10.3969/j.issn.2095-9400.2023.07.005
基于机器学习的成纤维细胞生长因子受体激酶抑制剂虚拟筛选模型
目的:构建基于机器学习的高效成纤维细胞生长因子受体(FGFR)激酶抑制剂虚拟筛选模型.方法:收集公共数据集BindingDB中的FGFR激酶抑制剂;用RDkit计算分子描述符表征化合物分子用以数据输入;采用随机森林和支持向量机两种机器学习算法建立虚拟筛选模型,用准确率、精准率、召回率、受试者工作特征曲线下面积(AUC)四个指标对模型进行评价;使用随机森林模型对1300万个化合物进行初步筛选;随后依次用Autodock Vina和Glide方法进一步筛选FGFR1激酶抑制剂;用分子动力学模拟对虚拟筛选得到的化合物进行分析.结果:构建的随机森林模型和支持向量机模型的准确率、精准率、召回率和AUC等评价指标有良好表现,随机森林模型的准确率和AUC分别可达0.878和0.952,随机森林模型可以用来作为FGFR激酶抑制剂的虚拟筛选模型.将随机森林模型用于大通量虚拟筛选获取高活性先导化合物,筛选所得3个最优化合物与FGFR1激酶的分子对接和分子动力学分析显示,在氢键、结合自由能、疏水作用与阳性药物AZD4547有较高相似性,FGFR1的LEU21、VAL29、ALA49三个残基是小分子药物保持稳定结合的重要残基.结论:本研究提供了一种基于机器学习的FGFR激酶抑制剂虚拟筛选模型,可以用于大规模小分子化合物库的高效筛选.
虚拟筛选、机器学习、分子动力学、成纤维细胞生长因子受体、激酶抑制剂
53
TP181;R965.1(自动化基础理论)
国家自然科学基金;浙江省自然科学基金项目
2023-07-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
548-555,564