AIDD·Atlas AI 制药学习地图
157

AI DTI 预测模型:序列、图、结构和知识图谱各解决不同问题

DTI/DTA 模型路线很多,但最重要的是任务定义和冷启动评估。序列模型、图模型、结构模型、知识图谱模型不能混为一谈。

药物-靶点相互作用预测包括 DTI(二分类或关系预测)和 DTA(亲和力回归)。很多文章把它们混写,但项目上二者服务的决策不同:重定位、靶点反筛、选择性评估、亲和力排序都需要不同数据。

主流路线

  • 序列路线:SMILES + 蛋白序列,代表 DeepDTA,成本低但结构信息弱。
  • 图路线:药物用分子图,代表 GraphDTA,药物表示更合理。
  • Transformer/交互路线:代表 MolTrans,强调子结构交互和可解释线索。
  • 结构路线:用口袋、对接姿势或复合物结构,更贴近物理但依赖结构质量。
  • 知识图谱路线:适合药物重定位和关系发现,但容易受已知研究偏差影响。

评估核心

  • 必须报告 drug cold、target cold 或 both cold;随机 pair split 常高估泛化。
  • 负样本构造会强烈影响结果,因为“未报道相互作用”不等于真阴性。
  • 分子胶和诱导邻近问题通常不是传统一对一 DTI 能直接覆盖的。

关键要点

  • DTI/DTA 路线要按决策场景选择;
  • 冷启动和负样本定义比模型名字更重要;
  • 分子胶项目需要额外考虑 E3-配体-底物三元关系。

延伸资源

  • 配套:139《GraphDTA》、140《DeepDTA》、141《MolTrans》。