AIDD·Atlas AI 制药学习地图
173

TDC:药物发现数据集和 Benchmark 工具箱

PyTDC 一行加载贯穿研发全流程的标准数据集、划分与评测,是系统认识任务与数据的工具箱。

TDC(Therapeutics Data Commons)把治疗类 ML 任务的数据、划分与评测标准化,用 Python 即可调用。

安装与部署

pip install PyTDC;首次加载会自动下载数据集。

典型用法

  • 加载 ADMET / DTI / HTS 等标准数据集
  • 使用随机/骨架/冷启动等推荐划分
  • 调用官方评测函数与 Benchmark Group
  • 对照公开排行榜校准预期

上手提示

从 ADMET 任务集起步,把数据、划分、指标一次性弄清楚;务必用官方划分,别自创,否则结果不可比。

延伸资源

  • 教程见 005、009;论文见 133。