ADMET 各终点相关、单任务数据有限,多任务学习能共享表征、提升小数据终点表现。
操作步骤
- 整理多终点数据为一张表(SMILES + 各性质列,允许缺失);
- 用 Chemprop 多任务模式或 DeepChem 多任务模型;
- 对缺失标签做掩码(只在有标签处计算损失);
- 用骨架划分评估每个终点;
- 对照单任务模型,确认多任务确有增益(防负迁移)。
常见坑与提示
不相关任务硬凑会负迁移;各终点样本量差异大需处理;TDC ADMET Group 提供现成多终点数据(见 244)。
延伸资源
- 概念见 156;数据见 244;下一步 335。