JetBrains 开源 120 亿参数 Mellum2 模型
2 小时前

JetBrains近日宣布,正式开源新一代面向软件工程系统的机器学习模型Mellum2。这距离其2025年开源首个Mellum模型仅一年多,首个Mellum模型专注于代码补全,参数规模约40亿。而Mellum2总参数量扩大至120亿,但JetBrains强调,通过采用稀疏专家混合(MoE)架构,每个token实际参与计算的活跃参数仅约25亿,因此,在标准硬件上仍能保持较快推理速度。