AIDD·Atlas AI 制药学习地图
149

MolMIM 论文精读:隐空间优化为什么不等于发现先导物

MolMIM 用 Mutual Information Machine 学习固定长度分子隐空间,再做属性约束优化。它适合受约束生成,但指标优化仍需化学和实验过滤。

MolMIM(Reidenbach 等, 2022/ICLR MLDD 2023)是一种面向受约束小分子生成的概率自编码模型。它用 Mutual Information Machine 训练,让可变长度 SMILES 映射到固定长度隐空间。

论文核心

  • 固定长度隐空间:便于在连续空间中搜索和优化。
  • 密集有效区域:训练目标鼓励隐空间附近采样能解码成合法分子。
  • CMA-ES 优化:在隐空间中做黑箱搜索,优化相似性约束和目标属性。

怎么不被高分误导

  • 论文中的目标多是标准化代理任务,项目中要换成真实多参数目标。
  • 相似性约束能保留已知 scaffold,但也可能限制跳出局部化学空间。
  • 隐空间优化输出必须做可合成性、专利、结构合理性和实验优先级判断。

关键要点

  • MolMIM = MIM 隐空间 + 受约束属性优化;
  • 适合做 analog generation 和局部优化探索;
  • 隐空间高分不等于先导物,需要 DMTA 验证。

延伸资源

  • 论文:Reidenbach et al., arXiv 2022 / ICLR MLDD 2023;配套:158《分子生成模型》。