AIDD·Atlas AI 制药学习地图
171

RDKit:化学信息学项目的事实标准工具

RDKit 是开源化学信息学的事实标准,几乎所有 AI 制药流程都以它为地基。

RDKit 是开源化学信息学库,提供分子解析、指纹、描述符、子结构、构象、绘图等全套能力,是 AI 制药项目的地基工具。

安装与部署

pip install rdkitconda install -c conda-forge rdkit;跨平台、有完整 Python 接口。

典型用法

  • 把 SMILES/SDF 读成 Mol 对象并标准化清洗
  • 算指纹(Morgan/ECFP)与 Tanimoto 相似性
  • 提取骨架、做子结构匹配与过滤(PAINS/Brenk)
  • 生成 3D 构象、计算描述符、画分子图

上手提示

先把官方 Getting Started 过一遍,建立 Mol/Atom/Bond 对象概念,再用 Cookbook(013)按任务查代码。RDKit 用熟,半个化学信息学就通了。

延伸资源

  • 官方 rdkit.org;概念见「分子表示」模块;工具栈见 055。