AIDD·Atlas AI 制药学习地图
194

ESM:蛋白语言模型工具箱怎么用

ESM 提供 ESM-2 等蛋白语言模型权重与接口,可提取蛋白表征用于多种下游任务。

ESM 是蛋白语言模型工具箱,提供 ESM-2 等预训练权重与 Python 接口。

安装与部署

pip install fair-esm 或经 Hugging Face transformers 加载;大模型需较多显存。

典型用法

  • 提取蛋白序列嵌入作为特征
  • 做突变效应/功能预测
  • 为下游任务提供表征
  • 接入 ESMFold 做结构预测

上手提示

按任务选模型规模:小模型快、大模型表征更强;显存不够时用较小变体或截断序列。

延伸资源

  • 论文见 143《ESM-2》;结构预测见 195。