近日,北京大学药学院联合西安交通大学人工智能与机器人研究所、华盛顿大学、香港中文大学及石河子大学等单位,在小分子天然产物智能表征与药物发现领域取得重要进展。研究团队提出了一种面向小分子天然产物的基础模型NaFM(Foundation Model for Natural Products),相关成果发表于国际高水平期刊《自然机器智能》(Nature Machine Intelligence)。天然产物因其结构多样性和生物活性,成为抗肿瘤、抗感染等药物发现的重要来源,但其发现过程面临周期长、成本高、数据有限等挑战。针对这些问题,研究团队以分子母核为核心构建表征框架,结合掩码图学习与对比学习,提出了母核感知的预训练策略。NaFM在预训练阶段基于COCONUT数据库中约60万条未标注天然产物结构数据,构建了分子表示学习框架,有效捕捉了天然产物在生物来源、合成途径及生物活性等多维属性间的内在关联。该研究为天然产物药物发现提供了新的智能工具,具有重要的科学价值和应用前景。
