AIDD·Atlas AI 制药学习地图
142

Uni-Mol 论文精读:3D 预训练何时比 SMILES/GNN 更有意义

Uni-Mol 是 ICLR 2023 的 3D 分子表示学习框架。它强调原子坐标和几何预训练,适合依赖空间构象的任务,但输入构象质量很关键。

Uni-Mol(Zhou 等, ICLR 2023)是一套面向 3D 分子表示学习的预训练框架。它的出发点是:很多药物发现任务不只取决于二维连接关系,还取决于三维构象、距离和空间相互作用。

它在学什么

  • 原子类型 + 坐标:模型直接接收三维原子坐标和距离关系。
  • 3D 预训练任务:通过坐标去噪、距离建模等任务学习空间表征。
  • 下游迁移:可用于分子性质预测、构象生成、蛋白-配体相关任务。

边界

  • 3D 模型的输入构象很重要;构象错了,模型学到的空间信息也会偏。
  • 对不依赖 3D 的简单性质,2D 指纹或 GNN 可能已经足够。
  • 对 docking、构象、形状/静电相关任务,3D 预训练更有优势。

关键要点

  • Uni-Mol 的核心是 3D 分子预训练;
  • 适合空间结构重要的任务,不是所有性质都需要 3D;
  • 构象生成和输入质量决定下游可信度。

延伸资源

  • 论文:Zhou et al., ICLR 2023;配套:104《Uni-Mol Docking》。