AIDD·Atlas AI 制药学习地图
141

MolTrans 论文精读:Transformer 做 DTI 时“可解释”要谨慎看

MolTrans 用子结构分解和 Transformer 建模药物-靶点相互作用。它比早期 CNN 更灵活,但注意力图不能直接等同真实结合机制。

MolTrans(Huang 等, Bioinformatics 2021)把 DTI 预测从简单序列 CNN 推向子结构级交互建模。它先从药物 SMILES 和蛋白序列中挖掘子结构/子序列,再用 Transformer 学习交互。

核心设计

  • 子结构分解:用频繁模式把药物和蛋白切成更有意义的片段。
  • Transformer 编码:捕捉片段之间的上下文关系。
  • 交互图:给出药物子结构和蛋白子序列的关联热图,增强可解释性。

审稿式阅读

  • 它预测的是 DTI/亲和力相关任务,不是直接预测复合物结构。
  • 注意力热图是模型解释线索,不等于实验证明的接触位点。
  • 真实部署应看冷启动划分、负样本构造和新靶点泛化。

关键要点

  • MolTrans = 子结构分解 + Transformer 交互建模;
  • 解释图有启发,但不能当作结合机制证据;
  • 判断价值要看冷启动和外部验证。

延伸资源

  • 论文:Huang et al., Bioinformatics 2021;配套:157《AI DTI 预测》。