模块 06
开源工具
化学信息学、对接、结构、模拟、生成的开源工具栈
- 171 RDKit:化学信息学项目的事实标准工具 RDKit 是开源化学信息学的事实标准,几乎所有 AI 制药流程都以它为地基。 →
- 172 DeepChem:AI 药物发现开源框架实战价值 DeepChem 把数据、特征、模型、划分统一成四件套,是新手跑通分子机器学习最省心的框架。 →
- 173 TDC:药物发现数据集和 Benchmark 工具箱 PyTDC 一行加载贯穿研发全流程的标准数据集、划分与评测,是系统认识任务与数据的工具箱。 →
- 174 Chemprop:分子性质预测模型训练入门 Chemprop 提供开箱即用的 D-MPNN 训练流程,是分子性质预测的强基线工具。 →
- 175 TorchDrug:面向药物发现的深度学习库 TorchDrug 把分子、蛋白、知识图谱等药物发现任务封装成统一的 PyTorch 接口,适合做研究与原型。 →
- 176 PyTorch Geometric:GNN 分子建模的基础框架 PyTorch Geometric(PyG)是图深度学习的主流框架,是自己实现分子 GNN 的基础设施。 →
- 177 DGL-LifeSci:生命科学图深度学习工具包 DGL-LifeSci 在 DGL 之上为分子与蛋白图任务提供现成模型与数据加载,是另一条 GNN 建模路线。 →
- 178 DeepPurpose:DTI、药物重定位与组合预测工具 DeepPurpose 用少量代码即可搭起 DTI、药物重定位与药物组合预测,适合快速起步与基线。 →
- 179 MoleculeNet 工具链:分子机器学习数据怎么用 MoleculeNet 提供标准分子数据集与划分,常通过 DeepChem 加载,是建立可比实验的起点。 →
- 180 DeepChem Examples:从示例项目学习 AI 制药 DeepChem 的示例与教程仓库用可运行项目串起分子 ML 全流程,是边做边学的好材料。 →
- 181 TeachOpenCADD:CADD 教学项目如何变成内部培训资料 TeachOpenCADD 的 talktorial 体系既能自学,也很适合改造成团队内部的 CADD 培训教材。 →
- 182 AutoDock Vina:开源对接工具部署指南 AutoDock Vina 是最常用的免费对接引擎,部署轻量、易脚本化,是虚拟筛选的入门标配。 →
- 183 GNINA:GPU 加速 Docking 与 CNN 重打分 GNINA 在 Vina 谱系上加入 CNN 打分与 GPU 加速,适合在对接后做深度学习重排序。 →
- 184 DiffDock:深度学习对接模型部署与使用 DiffDock 用扩散模型做盲对接,部署后可快速给出候选姿势与置信度,适合初筛。 →
- 185 EquiBind:快速结合姿势预测工具评估 EquiBind 一步直接预测结合姿势,速度极快,适合超大规模初筛,但精度有限需后处理。 →
- 186 TankBind:蛋白-配体结合预测工具实测 TankBind 预测分子间距离图并估计亲和力,兼顾姿势与打分,是几何建模路线的实用工具。 →
- 187 Uni-Mol:分子预训练模型部署指南 Uni-Mol 提供 3D 分子预训练权重与微调接口,部署后可迁移到性质预测、对接等任务。 →
- 188 Uni-Mol Docking V2:开源 Docking 工作流体验 Uni-Mol Docking V2 用预训练模型做对接,在姿势预测与物理合理性上有提升,可纳入自有筛选流程。 →
- 189 PaddleHelix:国产开源生物计算框架介绍 PaddleHelix 基于飞桨,覆盖结构预测、DTI 与分子生成,是中文生态友好的国产开源框架。 →
- 190 HelixFold3:国产结构预测模型应用指南 HelixFold3 是飞桨生态下的 AF3 类结构预测实现,可用于蛋白及复合物预测,是国产开源选项。 →
- 191 OpenFold:训练和推理 AlphaFold 类模型的开源方案 OpenFold 是可训练的开源 AlphaFold2 复现,适合需要微调或扩展结构预测模型的团队。 →
- 192 Boltz:开放结构预测工具的安装与使用 Boltz 是开放权重的 AF3 类结构预测工具,可本地批量预测复合物,不受网页配额限制。 →
- 193 Chai-1:复合物结构预测工具部署指南 Chai-1 面向药物发现、可本地运行,擅长多组分复合物预测,是开放结构预测的实用选项。 →
- 194 ESM:蛋白语言模型工具箱怎么用 ESM 提供 ESM-2 等蛋白语言模型权重与接口,可提取蛋白表征用于多种下游任务。 →
- 195 ESMFold:快速蛋白结构预测实战 ESMFold 免 MSA、从单序列快速预测结构,适合大规模或快速结构预测场景。 →
- 196 ProteinMPNN:蛋白序列设计工具实战 ProteinMPNN 给定骨架结构设计氨基酸序列,实验成功率高,是蛋白设计管线的核心工具。 →
- 197 RFdiffusion:蛋白骨架生成工具实战 RFdiffusion 用扩散模型按约束生成蛋白骨架,可做结合物设计与对称组装,是蛋白从头设计的主力。 →
- 198 Rosetta:经典蛋白设计平台为什么仍然重要 Rosetta 是积累深厚的蛋白建模与设计平台,在能量函数、设计协议上仍是很多工作的基础。 →
- 199 PyRosetta:用 Python 调用 Rosetta 的工程路线 PyRosetta 把 Rosetta 能力暴露为 Python 接口,便于脚本化与和 AI 工具集成。 →
- 200 OpenMM:分子动力学模拟开源引擎 OpenMM 是 GPU 加速、Python 友好的 MD 引擎,是跑蛋白-配体模拟的推荐起点。 →
- 201 OpenFE:自由能计算开源平台 OpenFE 提供可复现的相对结合自由能(RBFE)工作流,是先导优化中自由能计算的开源选择。 →
- 202 OpenFF Toolkit:小分子力场参数化工具 OpenFF Toolkit 给小分子生成现代力场参数,是 MD 与自由能计算前不可省略的一步。 →
- 203 Perses:炼金自由能计算工具介绍 Perses 基于 OpenMM 做炼金自由能计算(如 RBFE),适合研究与定制自由能方法。 →
- 204 YANK:结合自由能计算工具介绍 YANK 是基于 OpenMM 的结合自由能计算工具,常用于绝对结合自由能等研究性计算。 →
- 205 MDAnalysis:MD 轨迹分析工具 MDAnalysis 是用 Python 分析 MD 轨迹的主力库,能算 RMSD、相互作用等各类指标。 →
- 206 MDTraj:轻量级分子动力学轨迹分析 MDTraj 轻量、快速,适合做 MD 轨迹的几何计算与格式转换,是 MDAnalysis 的常用替代。 →
- 207 ProLIF:蛋白-配体相互作用指纹工具 ProLIF 把相互作用编码成可分析的指纹,适合比较姿势、统计 MD 轨迹中相互作用的稳定性。 →
- 208 PLIP:自动识别蛋白-配体相互作用 PLIP 自动识别氢键、疏水、π 堆积、盐桥等并出报告,快速理解结合模式。 →
- 209 ProDy:蛋白结构动力学分析工具 ProDy 擅长蛋白结构与柔性分析(如弹性网络模型、PCA),用于研究构象变化与功能运动。 →
- 210 Biopython:生物序列与结构数据处理基础 Biopython 是处理生物序列与结构数据的基础库,常用于序列解析、PDB 处理与数据库交互。 →
- 211 PyMOL 开源版:结构可视化和作图流程 PyMOL 开源版满足多数结构可视化与作图需求,掌握选择语法与渲染即可出版级配图。 →
- 212 NGLView:Jupyter 中展示三维结构 NGLView 在 Jupyter 里交互展示结构与轨迹,适合边分析边看的工作流。 →
- 213 3Dmol.js:把分子结构嵌入网页 3Dmol.js 是纯 JS 的三维分子查看库,适合把结构与对接结果嵌入网页或内部平台。 →
- 214 Meeko:Docking 文件准备工具 Meeko 把配体/受体转成 Vina 所需 PDBQT 并处理大环等细节,是 Vina 对接的标准前处理。 →
- 215 PDBFixer:蛋白结构修复工具 PDBFixer 补全缺失原子/残基、加氢、处理非标准残基,是对接与模拟前的结构修复利器。 →
- 216 OpenBabel:化学文件格式转换工具 OpenBabel 支持上百种化学格式互转,是处理格式不兼容的常备瑞士军刀。 →
- 217 Mols2grid:分子表格可视化工具 mols2grid 在 Notebook 里把一批分子渲染成可交互的网格表格,便于浏览、筛选与挑选。 →
- 218 Datamol:现代化学信息学数据处理工具 Datamol 在 RDKit 之上提供更简洁的 API 与并行处理,让分子数据清洗与处理更顺手。 →
- 219 Molfeat:分子特征工程工具箱 Molfeat 统一了多种分子特征化方法(指纹、描述符、预训练表征),让特征工程一站式完成。 →
- 220 DeepChem MolNet Loaders:标准数据集加载方法 DeepChem 的 MolNet loader 一行加载标准分子数据集与划分,是建立可比实验的便捷入口。 →
- 221 REINVENT4:分子生成平台部署与任务配置 REINVENT4 通过配置文件定义生成模式与多目标打分,是目标导向分子生成的工程化平台。 →
- 222 GuacaMol:分子生成模型评测工具 GuacaMol 提供分布学习与目标导向两类基准,用于客观评测分子生成模型。 →
- 223 MOSES:分子生成基准评测工具 MOSES 提供标准数据、指标与基线,衡量生成模型的有效性、新颖性与分布相似度。 →
- 224 CLI Agent 调用 CADD 工具:AI Agent 如何驱动计算流程 用 LLM Agent 通过命令行编排 RDKit、对接、模拟等工具,把零散步骤串成自动化的计算流程。 →
- 225 AI 制药工具工程化:从脚本到企业内部平台 把零散脚本沉淀为可复用、可复现、可协作的内部平台,是 AI 制药工具规模化落地的关键一步。 →