ChEMBL(由 EMBL-EBI 维护)是开源的生物活性数据库,从文献与专利中人工整理出海量化合物-靶点活性数据,是 AI 活性预测最常用的数据来源之一。
有什么数据
- 化合物结构与标准化标识
- 靶点、测定(assay)与活性值(IC50/Ki/EC50 等)
- 活性的实验类型、单位与可信度标记
- 文献来源与关联信息
怎么获取与使用
可通过网页检索、批量下载完整数据库(含 SQL/SDF),或用官方 REST API 与 Python 客户端(chembl_webresource_client)按需查询。
使用提示
活性数据来自不同实验,单位与条件不一,建模前务必按 assay/标准类型筛选、标准化并去重(见 046、047);注意活性值的可信度与方向。
延伸资源
- 对照 227《PubChem》、228《BindingDB》;实战见「实战流程」模块 326。