NVIDIA发布Nemotron 3 Super,面向高阶推理任务的开源混合架构模型
12 小时前

英伟达推出Nemotron 3 Super开源大语言模型,专为复杂多智能体推理设计,采用混合Mamba-Transformer架构与MoE机制,支持百万级token上下文窗口,推理速度较前代提升4倍,已开放完整权重、数据集及部署方案。