MegaMolBART 是 NVIDIA BioNeMo 生态中的分子序列模型,基于 BART/seq2seq 思路,以 SMILES 为输入输出。按 NVIDIA 文档,它更准确的定位是用于分子表示、分子生成和 retrosynthesis 等任务的 SMILES autoencoder。
它是什么
- 模型类型:Transformer encoder-decoder / BART 式自编码生成模型。
- 输入输出:主要处理 SMILES 文本,因此依赖 SMILES 标准化和合法性检查。
- 平台属性:更像 BioNeMo 中的可调用组件,版本、模型卡、许可和部署方式要按 NVIDIA 当前文档核对。
项目使用建议
- 适合作为生成和 embedding 原型,不要直接把生成结果送合成。
- 必须接 RDKit/合成可及性/ADMET/结构过滤,最好再接项目内模型。
- 商业项目使用前要核对模型版本、数据来源、license 和安全合规。
关键要点
- MegaMolBART = BioNeMo 中的 BART 式 SMILES 模型;
- 它提供生成和表示能力,不保证药物可用性;
- 使用前核对模型卡、版本、license 和下游过滤。
延伸资源
- 文档:NVIDIA BioNeMo MegaMolBART;相关论文:Chemformer, 2022。