NVIDIA 为消费者带来 15 亿至 320 亿个参数的推理模型
1 周前

NVIDIA今日发布了OpenReasoning-Nemotron模型集合,该集合包含四个参数规模分别为15亿、70亿、140亿和320亿的精简推理模型。这些模型均基于拥有671亿参数的DeepSeek R1 0528模型进行知识蒸馏而得,架构源于Qwen-2.5。通过这一技术,NVIDIA成功将庞大的“教师”模型压缩为四个高效的“学生”模型,使得高级推理实验得以在标准游戏设备上进行,大大降低了对高昂GPU费用和云使用量的依赖。 OpenReasoning-Nemotron模型集合的发布,标志着NVIDIA在推理模型领域取得了重要进展,为开发者和研究人员提供了更加便捷、高效的工具,以探索和利用高级推理能力。