AIDD·Atlas AI 制药学习地图
156

AI ADMET 预测模型:多任务学习有用,但不能掩盖实验体系差异

ADMET 多任务模型可共享表征、提高效率,但每个终点的实验体系、物种、阈值和适用域都不同,不能只看一个综合分。

AI ADMET 预测常用多任务学习,因为溶解度、通透性、CYP、hERG、清除率等终点彼此相关,而且单个终点数据常有限。但 ADMET 的难点首先是数据和实验体系,不只是模型架构。

为什么多任务

  • 共享表征:相同分子结构特征可同时影响多个 ADMET 终点。
  • 缓解小数据:某些终点样本少,可从相关任务借力。
  • 支持 MPO:一个模型同时输出多个性质,方便多参数优化。

必须警惕

  • 负迁移:不相关或噪声很大的任务会拖累其它终点。
  • 实验体系差异:人/鼠/犬、肝微粒体/肝细胞、Caco-2/MDCK 的意义不同。
  • 适用域:新骨架、带电分子、共价分子、大分子或分子胶样化合物可能超出训练分布。

关键要点

  • ADMET 多任务有价值,但数据定义比模型更关键;
  • 每个终点要看实验体系、物种和阈值;
  • 模型用于早期预警,关键决策仍要实验确认。

延伸资源

  • 配套:「成药性」模块;数据:TDC ADMET Group、ChEMBL、内部 DMPK 数据。