AIDD·Atlas AI 制药学习地图
347

用 REINVENT4 生成新分子:从规则到奖励函数

用 REINVENT4 配置生成模式与多目标奖励,从零生成满足约束的新分子。

REINVENT4 通过「写配置」而非改代码来做目标导向分子生成。本篇走一遍。

操作步骤

  1. 部署 REINVENT4,选生成模式(从头/骨架装饰/片段连接);
  2. 定义打分组件(活性模型、QED、SA、ADMET、对接分等);
  3. 设置各组件权重与转换函数,组成多目标奖励;
  4. 用强化学习运行生成,监控有效率与奖励;
  5. 筛选并人工审阅生成结果(mols2grid,见 217)。

常见坑与提示

奖励函数是成败关键,且模型会「钻空子」(reward hacking)——某组件设计不当会被刷分;务必加入有效性/可合成性约束,并人工审阅(见 348–351)。

延伸资源

  • 工具见 221;论文见 137、138;下一步 348。