ProteinMPNN(Dauparas 等, Science 2022)解决的是逆折叠问题:给定蛋白主链骨架,设计能折叠并稳定该骨架的氨基酸序列。它已成为 RFdiffusion 等骨架生成方法之后的常用序列设计模块。
核心贡献
- 结构条件生成序列:模型输入残基之间的几何关系,输出每个位置的氨基酸分布。
- 快且稳健:相比传统能量函数搜索,能更快生成大量候选序列。
- 适配多场景:单体、复合物界面、对称设计都可作为输入约束。
边界
- ProteinMPNN 不负责生成新骨架;骨架来自实验结构、Rosetta、RFdiffusion 等。
- 设计序列能否表达、折叠、结合和实现功能,仍需 AF2/结构过滤与实验验证。
- 对 binder 设计,界面几何和负设计同样关键,不能只看序列概率。
关键要点
- ProteinMPNN = 给定结构骨架的序列设计模型;
- 它改变了“骨架生成 → 序列设计 → 结构过滤”的蛋白设计流程;
- 功能和结合仍要靠实验闭环验证。
延伸资源
- 论文:Dauparas et al., Science 2022;配套:151《RFdiffusion》。