化合物基于相应数据、CATS描述符以及药物分子和靶标的三维构象进行设计和筛选。训练了一个神经网络用于预测靶标活性和化合物筛选。
- 训练集:
1.收集过去10年中900种已上市或正在进行临床试验的药物(38个靶点)。
2.对于每个结构,生成300个3D构象。
3.为每个样品选择了100种具有多样性的构象。
4.计算所有构象的CATS 3D描述符。
- 靶点集:
1.对ChemDiv库中超过150万种化合物应用了软性MCF和药物相似性筛选。
2.使用Corina软件为每个分子生成了3D构象,共计256,000个。
3.从初始构象中生成了100种构象,并从中筛选出约10种差异最大的构象(总计250万样本)。
4.对所有构象计算了CATS 3D描述符。
- 算法:
1.训练了一个神经网络用于预测目标活性。模型独立地对每个目标进行活性预测(0或1)。
2.通过迭代优化,为每个目标选择单独的二值化阈值以做出最终决策。
3.在训练集10%的验证集上计算了数值指标。此外,还在独立样本中的10种化合物上评估了模型的质量。