AIDD·Atlas AI 制药学习地图

163

大语言模型与药物发现：让 LLM 做编排，不要让它装成实验仪器

LLM 适合文献抽取、代码生成、工作流编排和报告解释；不适合直接预测 IC50、毒性或结合模式。它必须接工具、数据和验证。

大语言模型在药物发现中最有价值的位置，不是替代所有专用模型，而是做知识和工具的接口：读文献、整理证据、写脚本、调用 RDKit/对接/ADMET 模型、生成报告和 SOP。

适合做什么

文献和专利：抽取靶点、疾病、化合物、实验条件和结论。
工作流编排：生成脚本、调用 API、把工具串成可复现流程。
知识库和报告：把结构化数据变成可检索、可解释的项目记忆。

不适合直接做什么

不要直接问 LLM 某个分子的 IC50、hERG 风险或结合自由能。
不要把 LLM 生成的机制解释当事实；必须追溯来源和实验。
不要让 LLM 独立决定合成优先级；它应调用专用模型和规则。

关键要点

LLM 强在文本、编排、解释和知识管理；
数值预测交给专用模型，结论交给实验验证；
最佳形态是 LLM + 工具 + 数据库 + 审计日志。

延伸资源

配套：164《多模态模型》、170《论文阅读框架》。