AIDD·Atlas AI 制药学习地图
179

MoleculeNet 工具链:分子机器学习数据怎么用

MoleculeNet 提供标准分子数据集与划分,常通过 DeepChem 加载,是建立可比实验的起点。

MoleculeNet 是分子机器学习的标准数据集合(溶解度、毒性、活性等),常通过 DeepChem 的 loader 使用。

安装与部署

通过 DeepChem:dc.molnet.load_* 系列函数加载,自动下载并附带划分。

典型用法

  • 加载 ESOL/FreeSolv/Tox21 等标准集
  • 使用配套的随机/骨架划分
  • 用统一指标做模型对照
  • 作为新方法的基准数据

上手提示

用它做对照时,注意部分数据集偏小、有噪声,单一分数别过度解读,最好多基准 + 多种子。

延伸资源

  • 论文见 132;加载见 220《DeepChem MolNet Loaders》。