大语言模型在药物发现中最有价值的位置,不是替代所有专用模型,而是做知识和工具的接口:读文献、整理证据、写脚本、调用 RDKit/对接/ADMET 模型、生成报告和 SOP。
适合做什么
- 文献和专利:抽取靶点、疾病、化合物、实验条件和结论。
- 工作流编排:生成脚本、调用 API、把工具串成可复现流程。
- 知识库和报告:把结构化数据变成可检索、可解释的项目记忆。
不适合直接做什么
- 不要直接问 LLM 某个分子的 IC50、hERG 风险或结合自由能。
- 不要把 LLM 生成的机制解释当事实;必须追溯来源和实验。
- 不要让 LLM 独立决定合成优先级;它应调用专用模型和规则。
关键要点
- LLM 强在文本、编排、解释和知识管理;
- 数值预测交给专用模型,结论交给实验验证;
- 最佳形态是 LLM + 工具 + 数据库 + 审计日志。
延伸资源
- 配套:164《多模态模型》、170《论文阅读框架》。