- 全部删除
- 您的购物车当前为空
该库根据以下策略设计:
-分析ChEMBL数据库中的cPLA2抑制剂数据,包含399种配体,作为开发基于配体的虚拟筛选集的主要支架来源;
-利用人类cPLA2晶体结构进行基于结构的设计。
上述策略通过以下工作流程在库构建中实施:
-排除具有不良物理化学特性的化合物;
-通过子结构过滤去除泛测定干扰化合物(PAINs);
-基于非药物化学友好SMARTS的过滤;
-排除高亲脂性化合物(由Molsoft软件预测的cLogP);
-采用基于配体的方法和分子对接相结合的虚拟筛选程序;
-使用“最小-最大”算法进行结构多样性驱动的化合物选择。
配体开发方法:
-基于ICM模型预测的亲脂性值(cLogP)进行库存收集筛选;
-初始分类机器学习(ML)模型驱动的虚拟筛选过滤;
-使用ChEMBL数据库作为训练数据源,该数据库包含399条已知cPLA2抑制剂生物活性的相关数据记录。训练集中的诱饵采用DUD-E方法生成,而测试集中的诱饵则从ChEMBL数据中整理。
-部署了两个独立的ML模型:一个基于计数型Morgan指纹构建的随机森林模型,以及一个基于ECFP4指纹构建的XGBoost模型。
-这些模型预测的化合物及其相关评分被汇编为最终结果。
-针对化学空间覆盖增强的多样性目标化合物选择;
-从库存收集中基于配体的选择产生了约10万种多样化化合物,适合后续基于结构的研究。
基于结构的研究使用了从蛋白质数据库(PDB)获得的数据,该数据库提供了一个具有所需CAP/Lid结构域的唯一结构(Uniprot ID P47712,PDB代码:1CJY)。Lid区域结构(PDB代码:1CJY)包含一些未解析的环和侧链,作为潜在的药物结合位点。使用FREAD方法对这些片段进行建模,然后进行更多的分子动力学研究以改进目标区域的采样。
该过程的关键步骤包括:
-使用OpenMM引擎在显式模拟的溶剂分子中进行10纳秒的分子动力学模拟,以提高Lid/CAP区域的采样;
-使用ICM算法进行结合位点检测,重点关注在模拟中表现稳定的位点;
-通过CAP区域的RMSD值对MD轨迹进行聚类,在对接研究中选出了三个最密集的簇;
-使用Flare软件(Cresset)进行分子对接和评分;
-实施互补的静电计算(Flare, Cresset)作为额外的基于结构的方法。
基于结构的策略满足以下标准:
-部署了10纳秒的分子动力学以采样结合位点构象
-使用共识对接法选择由分子动力学生成的三个最密集的簇
-补充的静电计算
-基于对接和静电计算的结构选择产生了约17,000个得分最高的化合物
-基于多样性的化合物选择产生了5,600个化合物
-基本物理化学性质的分布和代表性结构显示在上面的幻灯片中。