AI ADMET 预测常用多任务学习,因为溶解度、通透性、CYP、hERG、清除率等终点彼此相关,而且单个终点数据常有限。但 ADMET 的难点首先是数据和实验体系,不只是模型架构。
为什么多任务
- 共享表征:相同分子结构特征可同时影响多个 ADMET 终点。
- 缓解小数据:某些终点样本少,可从相关任务借力。
- 支持 MPO:一个模型同时输出多个性质,方便多参数优化。
必须警惕
- 负迁移:不相关或噪声很大的任务会拖累其它终点。
- 实验体系差异:人/鼠/犬、肝微粒体/肝细胞、Caco-2/MDCK 的意义不同。
- 适用域:新骨架、带电分子、共价分子、大分子或分子胶样化合物可能超出训练分布。
关键要点
- ADMET 多任务有价值,但数据定义比模型更关键;
- 每个终点要看实验体系、物种和阈值;
- 模型用于早期预警,关键决策仍要实验确认。
延伸资源
- 配套:「成药性」模块;数据:TDC ADMET Group、ChEMBL、内部 DMPK 数据。