AIDD·Atlas AI 制药学习地图

156

AI ADMET 预测模型：多任务学习有用，但不能掩盖实验体系差异

ADMET 多任务模型可共享表征、提高效率，但每个终点的实验体系、物种、阈值和适用域都不同，不能只看一个综合分。

AI ADMET 预测常用多任务学习，因为溶解度、通透性、CYP、hERG、清除率等终点彼此相关，而且单个终点数据常有限。但 ADMET 的难点首先是数据和实验体系，不只是模型架构。

为什么多任务

共享表征：相同分子结构特征可同时影响多个 ADMET 终点。
缓解小数据：某些终点样本少，可从相关任务借力。
支持 MPO：一个模型同时输出多个性质，方便多参数优化。

必须警惕

负迁移：不相关或噪声很大的任务会拖累其它终点。
实验体系差异：人/鼠/犬、肝微粒体/肝细胞、Caco-2/MDCK 的意义不同。
适用域：新骨架、带电分子、共价分子、大分子或分子胶样化合物可能超出训练分布。

关键要点

ADMET 多任务有价值，但数据定义比模型更关键；
每个终点要看实验体系、物种和阈值；
模型用于早期预警，关键决策仍要实验确认。

延伸资源

配套：「成药性」模块；数据：TDC ADMET Group、ChEMBL、内部 DMPK 数据。