AIDD·Atlas AI 制药学习地图
模块 06

开源工具

化学信息学、对接、结构、模拟、生成的开源工具栈

  1. 171 RDKit:化学信息学项目的事实标准工具 RDKit 是开源化学信息学的事实标准,几乎所有 AI 制药流程都以它为地基。
  2. 172 DeepChem:AI 药物发现开源框架实战价值 DeepChem 把数据、特征、模型、划分统一成四件套,是新手跑通分子机器学习最省心的框架。
  3. 173 TDC:药物发现数据集和 Benchmark 工具箱 PyTDC 一行加载贯穿研发全流程的标准数据集、划分与评测,是系统认识任务与数据的工具箱。
  4. 174 Chemprop:分子性质预测模型训练入门 Chemprop 提供开箱即用的 D-MPNN 训练流程,是分子性质预测的强基线工具。
  5. 175 TorchDrug:面向药物发现的深度学习库 TorchDrug 把分子、蛋白、知识图谱等药物发现任务封装成统一的 PyTorch 接口,适合做研究与原型。
  6. 176 PyTorch Geometric:GNN 分子建模的基础框架 PyTorch Geometric(PyG)是图深度学习的主流框架,是自己实现分子 GNN 的基础设施。
  7. 177 DGL-LifeSci:生命科学图深度学习工具包 DGL-LifeSci 在 DGL 之上为分子与蛋白图任务提供现成模型与数据加载,是另一条 GNN 建模路线。
  8. 178 DeepPurpose:DTI、药物重定位与组合预测工具 DeepPurpose 用少量代码即可搭起 DTI、药物重定位与药物组合预测,适合快速起步与基线。
  9. 179 MoleculeNet 工具链:分子机器学习数据怎么用 MoleculeNet 提供标准分子数据集与划分,常通过 DeepChem 加载,是建立可比实验的起点。
  10. 180 DeepChem Examples:从示例项目学习 AI 制药 DeepChem 的示例与教程仓库用可运行项目串起分子 ML 全流程,是边做边学的好材料。
  11. 181 TeachOpenCADD:CADD 教学项目如何变成内部培训资料 TeachOpenCADD 的 talktorial 体系既能自学,也很适合改造成团队内部的 CADD 培训教材。
  12. 182 AutoDock Vina:开源对接工具部署指南 AutoDock Vina 是最常用的免费对接引擎,部署轻量、易脚本化,是虚拟筛选的入门标配。
  13. 183 GNINA:GPU 加速 Docking 与 CNN 重打分 GNINA 在 Vina 谱系上加入 CNN 打分与 GPU 加速,适合在对接后做深度学习重排序。
  14. 184 DiffDock:深度学习对接模型部署与使用 DiffDock 用扩散模型做盲对接,部署后可快速给出候选姿势与置信度,适合初筛。
  15. 185 EquiBind:快速结合姿势预测工具评估 EquiBind 一步直接预测结合姿势,速度极快,适合超大规模初筛,但精度有限需后处理。
  16. 186 TankBind:蛋白-配体结合预测工具实测 TankBind 预测分子间距离图并估计亲和力,兼顾姿势与打分,是几何建模路线的实用工具。
  17. 187 Uni-Mol:分子预训练模型部署指南 Uni-Mol 提供 3D 分子预训练权重与微调接口,部署后可迁移到性质预测、对接等任务。
  18. 188 Uni-Mol Docking V2:开源 Docking 工作流体验 Uni-Mol Docking V2 用预训练模型做对接,在姿势预测与物理合理性上有提升,可纳入自有筛选流程。
  19. 189 PaddleHelix:国产开源生物计算框架介绍 PaddleHelix 基于飞桨,覆盖结构预测、DTI 与分子生成,是中文生态友好的国产开源框架。
  20. 190 HelixFold3:国产结构预测模型应用指南 HelixFold3 是飞桨生态下的 AF3 类结构预测实现,可用于蛋白及复合物预测,是国产开源选项。
  21. 191 OpenFold:训练和推理 AlphaFold 类模型的开源方案 OpenFold 是可训练的开源 AlphaFold2 复现,适合需要微调或扩展结构预测模型的团队。
  22. 192 Boltz:开放结构预测工具的安装与使用 Boltz 是开放权重的 AF3 类结构预测工具,可本地批量预测复合物,不受网页配额限制。
  23. 193 Chai-1:复合物结构预测工具部署指南 Chai-1 面向药物发现、可本地运行,擅长多组分复合物预测,是开放结构预测的实用选项。
  24. 194 ESM:蛋白语言模型工具箱怎么用 ESM 提供 ESM-2 等蛋白语言模型权重与接口,可提取蛋白表征用于多种下游任务。
  25. 195 ESMFold:快速蛋白结构预测实战 ESMFold 免 MSA、从单序列快速预测结构,适合大规模或快速结构预测场景。
  26. 196 ProteinMPNN:蛋白序列设计工具实战 ProteinMPNN 给定骨架结构设计氨基酸序列,实验成功率高,是蛋白设计管线的核心工具。
  27. 197 RFdiffusion:蛋白骨架生成工具实战 RFdiffusion 用扩散模型按约束生成蛋白骨架,可做结合物设计与对称组装,是蛋白从头设计的主力。
  28. 198 Rosetta:经典蛋白设计平台为什么仍然重要 Rosetta 是积累深厚的蛋白建模与设计平台,在能量函数、设计协议上仍是很多工作的基础。
  29. 199 PyRosetta:用 Python 调用 Rosetta 的工程路线 PyRosetta 把 Rosetta 能力暴露为 Python 接口,便于脚本化与和 AI 工具集成。
  30. 200 OpenMM:分子动力学模拟开源引擎 OpenMM 是 GPU 加速、Python 友好的 MD 引擎,是跑蛋白-配体模拟的推荐起点。
  31. 201 OpenFE:自由能计算开源平台 OpenFE 提供可复现的相对结合自由能(RBFE)工作流,是先导优化中自由能计算的开源选择。
  32. 202 OpenFF Toolkit:小分子力场参数化工具 OpenFF Toolkit 给小分子生成现代力场参数,是 MD 与自由能计算前不可省略的一步。
  33. 203 Perses:炼金自由能计算工具介绍 Perses 基于 OpenMM 做炼金自由能计算(如 RBFE),适合研究与定制自由能方法。
  34. 204 YANK:结合自由能计算工具介绍 YANK 是基于 OpenMM 的结合自由能计算工具,常用于绝对结合自由能等研究性计算。
  35. 205 MDAnalysis:MD 轨迹分析工具 MDAnalysis 是用 Python 分析 MD 轨迹的主力库,能算 RMSD、相互作用等各类指标。
  36. 206 MDTraj:轻量级分子动力学轨迹分析 MDTraj 轻量、快速,适合做 MD 轨迹的几何计算与格式转换,是 MDAnalysis 的常用替代。
  37. 207 ProLIF:蛋白-配体相互作用指纹工具 ProLIF 把相互作用编码成可分析的指纹,适合比较姿势、统计 MD 轨迹中相互作用的稳定性。
  38. 208 PLIP:自动识别蛋白-配体相互作用 PLIP 自动识别氢键、疏水、π 堆积、盐桥等并出报告,快速理解结合模式。
  39. 209 ProDy:蛋白结构动力学分析工具 ProDy 擅长蛋白结构与柔性分析(如弹性网络模型、PCA),用于研究构象变化与功能运动。
  40. 210 Biopython:生物序列与结构数据处理基础 Biopython 是处理生物序列与结构数据的基础库,常用于序列解析、PDB 处理与数据库交互。
  41. 211 PyMOL 开源版:结构可视化和作图流程 PyMOL 开源版满足多数结构可视化与作图需求,掌握选择语法与渲染即可出版级配图。
  42. 212 NGLView:Jupyter 中展示三维结构 NGLView 在 Jupyter 里交互展示结构与轨迹,适合边分析边看的工作流。
  43. 213 3Dmol.js:把分子结构嵌入网页 3Dmol.js 是纯 JS 的三维分子查看库,适合把结构与对接结果嵌入网页或内部平台。
  44. 214 Meeko:Docking 文件准备工具 Meeko 把配体/受体转成 Vina 所需 PDBQT 并处理大环等细节,是 Vina 对接的标准前处理。
  45. 215 PDBFixer:蛋白结构修复工具 PDBFixer 补全缺失原子/残基、加氢、处理非标准残基,是对接与模拟前的结构修复利器。
  46. 216 OpenBabel:化学文件格式转换工具 OpenBabel 支持上百种化学格式互转,是处理格式不兼容的常备瑞士军刀。
  47. 217 Mols2grid:分子表格可视化工具 mols2grid 在 Notebook 里把一批分子渲染成可交互的网格表格,便于浏览、筛选与挑选。
  48. 218 Datamol:现代化学信息学数据处理工具 Datamol 在 RDKit 之上提供更简洁的 API 与并行处理,让分子数据清洗与处理更顺手。
  49. 219 Molfeat:分子特征工程工具箱 Molfeat 统一了多种分子特征化方法(指纹、描述符、预训练表征),让特征工程一站式完成。
  50. 220 DeepChem MolNet Loaders:标准数据集加载方法 DeepChem 的 MolNet loader 一行加载标准分子数据集与划分,是建立可比实验的便捷入口。
  51. 221 REINVENT4:分子生成平台部署与任务配置 REINVENT4 通过配置文件定义生成模式与多目标打分,是目标导向分子生成的工程化平台。
  52. 222 GuacaMol:分子生成模型评测工具 GuacaMol 提供分布学习与目标导向两类基准,用于客观评测分子生成模型。
  53. 223 MOSES:分子生成基准评测工具 MOSES 提供标准数据、指标与基线,衡量生成模型的有效性、新颖性与分布相似度。
  54. 224 CLI Agent 调用 CADD 工具:AI Agent 如何驱动计算流程 用 LLM Agent 通过命令行编排 RDKit、对接、模拟等工具,把零散步骤串成自动化的计算流程。
  55. 225 AI 制药工具工程化:从脚本到企业内部平台 把零散脚本沉淀为可复用、可复现、可协作的内部平台,是 AI 制药工具规模化落地的关键一步。