AIDD·Atlas AI 制药学习地图
226

ChEMBL:药物活性数据的核心数据库

ChEMBL 是开源生物活性数据的核心库,汇集大量从文献整理的化合物-靶点活性,是 AI 活性建模的主要数据来源。

ChEMBL(由 EMBL-EBI 维护)是开源的生物活性数据库,从文献与专利中人工整理出海量化合物-靶点活性数据,是 AI 活性预测最常用的数据来源之一。

有什么数据

  • 化合物结构与标准化标识
  • 靶点、测定(assay)与活性值(IC50/Ki/EC50 等)
  • 活性的实验类型、单位与可信度标记
  • 文献来源与关联信息

怎么获取与使用

可通过网页检索、批量下载完整数据库(含 SQL/SDF),或用官方 REST API 与 Python 客户端(chembl_webresource_client)按需查询。

使用提示

活性数据来自不同实验,单位与条件不一,建模前务必按 assay/标准类型筛选、标准化并去重(见 046、047);注意活性值的可信度与方向。

延伸资源

  • 对照 227《PubChem》、228《BindingDB》;实战见「实战流程」模块 326。