RDKit 是开源化学信息学库,提供分子解析、指纹、描述符、子结构、构象、绘图等全套能力,是 AI 制药项目的地基工具。
安装与部署
pip install rdkit 或 conda install -c conda-forge rdkit;跨平台、有完整 Python 接口。
典型用法
- 把 SMILES/SDF 读成 Mol 对象并标准化清洗
- 算指纹(Morgan/ECFP)与 Tanimoto 相似性
- 提取骨架、做子结构匹配与过滤(PAINS/Brenk)
- 生成 3D 构象、计算描述符、画分子图
上手提示
先把官方 Getting Started 过一遍,建立 Mol/Atom/Bond 对象概念,再用 Cookbook(013)按任务查代码。RDKit 用熟,半个化学信息学就通了。
延伸资源
- 官方 rdkit.org;概念见「分子表示」模块;工具栈见 055。