Uni-Mol(Zhou 等, ICLR 2023)是一套面向 3D 分子表示学习的预训练框架。它的出发点是:很多药物发现任务不只取决于二维连接关系,还取决于三维构象、距离和空间相互作用。
它在学什么
- 原子类型 + 坐标:模型直接接收三维原子坐标和距离关系。
- 3D 预训练任务:通过坐标去噪、距离建模等任务学习空间表征。
- 下游迁移:可用于分子性质预测、构象生成、蛋白-配体相关任务。
边界
- 3D 模型的输入构象很重要;构象错了,模型学到的空间信息也会偏。
- 对不依赖 3D 的简单性质,2D 指纹或 GNN 可能已经足够。
- 对 docking、构象、形状/静电相关任务,3D 预训练更有优势。
关键要点
- Uni-Mol 的核心是 3D 分子预训练;
- 适合空间结构重要的任务,不是所有性质都需要 3D;
- 构象生成和输入质量决定下游可信度。
延伸资源
- 论文:Zhou et al., ICLR 2023;配套:104《Uni-Mol Docking》。