药物-靶点相互作用预测包括 DTI(二分类或关系预测)和 DTA(亲和力回归)。很多文章把它们混写,但项目上二者服务的决策不同:重定位、靶点反筛、选择性评估、亲和力排序都需要不同数据。
主流路线
- 序列路线:SMILES + 蛋白序列,代表 DeepDTA,成本低但结构信息弱。
- 图路线:药物用分子图,代表 GraphDTA,药物表示更合理。
- Transformer/交互路线:代表 MolTrans,强调子结构交互和可解释线索。
- 结构路线:用口袋、对接姿势或复合物结构,更贴近物理但依赖结构质量。
- 知识图谱路线:适合药物重定位和关系发现,但容易受已知研究偏差影响。
评估核心
- 必须报告 drug cold、target cold 或 both cold;随机 pair split 常高估泛化。
- 负样本构造会强烈影响结果,因为“未报道相互作用”不等于真阴性。
- 分子胶和诱导邻近问题通常不是传统一对一 DTI 能直接覆盖的。
关键要点
- DTI/DTA 路线要按决策场景选择;
- 冷启动和负样本定义比模型名字更重要;
- 分子胶项目需要额外考虑 E3-配体-底物三元关系。
延伸资源
- 配套:139《GraphDTA》、140《DeepDTA》、141《MolTrans》。