基于机器学习的化合物血脑屏障通透性预测
目的 建立基于机器学习的化合物血脑屏障通透性(logBB)预测模型,并评价其预测效果.方法 收集360个化合物的分子结构信息与相应的logBB,使用遗传算法结合极端梯度提升算法来构建化合物logBB预测模型.结果 经十折交叉验证,模型的预测平方相关系数为0.63,均方误差为0.23,表现出良好的预测性能.此外,通过对模型特征重要性的分析,总结了对化合物logBB影响程度最高的前5个分子描述符,分别是拓扑极性表面积、氢键、疏水/亲水性、油水分配系数、辛醇水分配系数.结论 模型的预测性能优于仅使用极端梯度提升算法或使用遗传算法结合支持向量机来构建的模型性能,且远优于discovery studio(DS,2016版)软件自带的预测算法性能.本研究可为治疗脑部相关疾病的药物研发提供指导性意义.
血脑屏障;药物研发;分子描述符;机器学习;极端梯度提升;遗传算法
56
R911(药物基础科学)
2021-12-07(万方平台首次上网日期,不代表论文的发表时间)
共7页
1677-1683