AIDD·Atlas AI 制药学习地图
163

大语言模型与药物发现:让 LLM 做编排,不要让它装成实验仪器

LLM 适合文献抽取、代码生成、工作流编排和报告解释;不适合直接预测 IC50、毒性或结合模式。它必须接工具、数据和验证。

大语言模型在药物发现中最有价值的位置,不是替代所有专用模型,而是做知识和工具的接口:读文献、整理证据、写脚本、调用 RDKit/对接/ADMET 模型、生成报告和 SOP。

适合做什么

  • 文献和专利:抽取靶点、疾病、化合物、实验条件和结论。
  • 工作流编排:生成脚本、调用 API、把工具串成可复现流程。
  • 知识库和报告:把结构化数据变成可检索、可解释的项目记忆。

不适合直接做什么

  • 不要直接问 LLM 某个分子的 IC50、hERG 风险或结合自由能。
  • 不要把 LLM 生成的机制解释当事实;必须追溯来源和实验。
  • 不要让 LLM 独立决定合成优先级;它应调用专用模型和规则。

关键要点

  • LLM 强在文本、编排、解释和知识管理;
  • 数值预测交给专用模型,结论交给实验验证;
  • 最佳形态是 LLM + 工具 + 数据库 + 审计日志。

延伸资源

  • 配套:164《多模态模型》、170《论文阅读框架》。