AIDD·Atlas AI 制药学习地图
158

AI 分子生成模型:VAE、GAN、RL、Diffusion 不是同一种工具

分子生成模型要按任务选型:分布学习、局部类似物优化、3D 构象生成、口袋条件生成和多目标优化对应不同范式。

AI 分子生成不是一个单一任务。生成“像药的分子”、围绕 lead 做 analog、根据口袋生成 3D 分子、优化多参数性质,是不同问题。VAE、GAN、RL、diffusion 各有适用场景。

范式比较

  • VAE/自编码器:适合隐空间插值、相似性约束和局部优化,如 MolMIM。
  • GAN:历史上用于分子生成,但训练不稳定、模式塌缩问题明显。
  • RL/目标导向:适合明确奖励函数的优化,如 REINVENT;风险是奖励被钻空子。
  • 扩散模型:适合 3D 构象、口袋条件生成、蛋白/结构生成等空间任务。

实战判断

  • 先问生成约束:保留 scaffold?满足 pharmacophore?结合口袋?避开专利?可合成?
  • 生成后必须去重、标准化、过滤反应性/PAINS、评估合成路线和 ADMET。
  • 多样性、可解释性和可合成性通常比单个代理分数更重要。

关键要点

  • 生成范式要按任务选,不是越新越好;
  • RL 容易刷奖励,扩散适合 3D,VAE 适合隐空间局部优化;
  • 生成模型必须接化学过滤和 DMTA 实验闭环。

延伸资源

  • 配套:135《GuacaMol》、137《REINVENT》、149《MolMIM》。