AI 分子生成不是一个单一任务。生成“像药的分子”、围绕 lead 做 analog、根据口袋生成 3D 分子、优化多参数性质,是不同问题。VAE、GAN、RL、diffusion 各有适用场景。
范式比较
- VAE/自编码器:适合隐空间插值、相似性约束和局部优化,如 MolMIM。
- GAN:历史上用于分子生成,但训练不稳定、模式塌缩问题明显。
- RL/目标导向:适合明确奖励函数的优化,如 REINVENT;风险是奖励被钻空子。
- 扩散模型:适合 3D 构象、口袋条件生成、蛋白/结构生成等空间任务。
实战判断
- 先问生成约束:保留 scaffold?满足 pharmacophore?结合口袋?避开专利?可合成?
- 生成后必须去重、标准化、过滤反应性/PAINS、评估合成路线和 ADMET。
- 多样性、可解释性和可合成性通常比单个代理分数更重要。
关键要点
- 生成范式要按任务选,不是越新越好;
- RL 容易刷奖励,扩散适合 3D,VAE 适合隐空间局部优化;
- 生成模型必须接化学过滤和 DMTA 实验闭环。
延伸资源
- 配套:135《GuacaMol》、137《REINVENT》、149《MolMIM》。