AIDD·Atlas AI 制药学习地图

347

用 REINVENT4 生成新分子：从规则到奖励函数

用 REINVENT4 配置生成模式与多目标奖励，从零生成满足约束的新分子。

REINVENT4 通过「写配置」而非改代码来做目标导向分子生成。本篇走一遍。

操作步骤

部署 REINVENT4，选生成模式（从头/骨架装饰/片段连接）；
定义打分组件（活性模型、QED、SA、ADMET、对接分等）；
设置各组件权重与转换函数，组成多目标奖励；
用强化学习运行生成，监控有效率与奖励；
筛选并人工审阅生成结果（mols2grid，见 217）。

常见坑与提示

奖励函数是成败关键，且模型会「钻空子」（reward hacking）——某组件设计不当会被刷分；务必加入有效性/可合成性约束，并人工审阅（见 348–351）。

延伸资源

工具见 221；论文见 137、138；下一步 348。