AIDD·Atlas AI 制药学习地图

158

AI 分子生成模型：VAE、GAN、RL、Diffusion 不是同一种工具

分子生成模型要按任务选型：分布学习、局部类似物优化、3D 构象生成、口袋条件生成和多目标优化对应不同范式。

AI 分子生成不是一个单一任务。生成“像药的分子”、围绕 lead 做 analog、根据口袋生成 3D 分子、优化多参数性质，是不同问题。VAE、GAN、RL、diffusion 各有适用场景。

范式比较

VAE/自编码器：适合隐空间插值、相似性约束和局部优化，如 MolMIM。
GAN：历史上用于分子生成，但训练不稳定、模式塌缩问题明显。
RL/目标导向：适合明确奖励函数的优化，如 REINVENT；风险是奖励被钻空子。
扩散模型：适合 3D 构象、口袋条件生成、蛋白/结构生成等空间任务。

实战判断

先问生成约束：保留 scaffold？满足 pharmacophore？结合口袋？避开专利？可合成？
生成后必须去重、标准化、过滤反应性/PAINS、评估合成路线和 ADMET。
多样性、可解释性和可合成性通常比单个代理分数更重要。

关键要点

生成范式要按任务选，不是越新越好；
RL 容易刷奖励，扩散适合 3D，VAE 适合隐空间局部优化；
生成模型必须接化学过滤和 DMTA 实验闭环。

延伸资源

配套：135《GuacaMol》、137《REINVENT》、149《MolMIM》。