MolTrans(Huang 等, Bioinformatics 2021)把 DTI 预测从简单序列 CNN 推向子结构级交互建模。它先从药物 SMILES 和蛋白序列中挖掘子结构/子序列,再用 Transformer 学习交互。
核心设计
- 子结构分解:用频繁模式把药物和蛋白切成更有意义的片段。
- Transformer 编码:捕捉片段之间的上下文关系。
- 交互图:给出药物子结构和蛋白子序列的关联热图,增强可解释性。
审稿式阅读
- 它预测的是 DTI/亲和力相关任务,不是直接预测复合物结构。
- 注意力热图是模型解释线索,不等于实验证明的接触位点。
- 真实部署应看冷启动划分、负样本构造和新靶点泛化。
关键要点
- MolTrans = 子结构分解 + Transformer 交互建模;
- 解释图有启发,但不能当作结合机制证据;
- 判断价值要看冷启动和外部验证。
延伸资源
- 论文:Huang et al., Bioinformatics 2021;配套:157《AI DTI 预测》。