蚂蚁百灵大模型团队宣布正式开源两款全新高效思考模型——Ring-flash-linear-2.0和Ring-mini-linear-2.0,并发布两款自主研发的高性能融合算子。通过架构优化与算子协同,新模型在深度推理场景下成本显著降低,仅为同等规模密集模型的十分之一,较之前Ring系列成本降幅超50%。其训练与推理引擎算子高度对齐,在多个高难度推理榜单中保持领先。目前,这两款模型已在Hugging Face和ModelScope等平台发布,此举不仅展示了团队的技术实力,也为开发者提供了高效工具。