AIDD·Atlas AI 制药学习地图
238

PDBbind:结合亲和力数据集怎么用于 AI 训练

PDBbind 把 PDB 中的蛋白-配体复合物配上实测结合亲和力,是打分函数与亲和力模型的常用训练/评测集。

PDBbind 收录 PDB 中带实测结合亲和力的蛋白-配体复合物,并分成 general/refined/core 子集。

有什么数据

  • 蛋白-配体复合物结构
  • 对应的结合亲和力(Kd/Ki/IC50)
  • general/refined/core 分层子集
  • core set 常作打分函数评测

怎么获取与使用

按学术用途获取数据集;用于训练/评测结合亲和力预测与打分函数(如 CASF 基准基于其 core set)。

使用提示

注意数据集的相似性泄漏与时间泄漏问题(训练/测试有相近复合物会虚高,见 169);评测打分函数要用规范基准。

延伸资源

  • 对照 239《Binding MOAD》、240《CrossDocked2020》;打分见 095。