AIDD·Atlas AI 制药学习地图
165

主动学习 Active Learning:少做实验的前提是知道该问哪个问题

主动学习通过模型挑选最值得实验的分子,但采集策略要服务项目决策:探索未知、优化活性、降低不确定性还是平衡 ADMET。

主动学习让模型参与“下一批做什么实验”的决策。它不是简单挑预测分最高的分子,而是在探索和利用之间做权衡,用更少实验获得最大信息量。

常见采集策略

  • 不确定性采样:优先做模型最不确定的分子,改善模型。
  • 贪心利用:优先做预测最优的分子,追求短期项目推进。
  • 多样性采样:覆盖更多化学空间,避免同质化。
  • 贝叶斯优化:综合预测均值和不确定性,平衡探索/利用。

药研落地条件

  • 必须有可靠的不确定性估计;如果模型过度自信,主动学习会走偏。
  • 合成周期和实验成本必须纳入采集函数,不能只看模型信息量。
  • 每轮实验数据要及时标准化并回灌,形成真正 DMTA 闭环。

关键要点

  • 主动学习选的是“最值得实验”的分子,不一定是最高分分子;
  • 采集策略要匹配项目阶段;
  • 不确定性、合成成本和实验回灌是落地关键。

延伸资源

  • 配套:166《不确定性估计》、DMTA 实战流程模块。