华为云与 MiniMax 最新模型 M3 实现开源首发适配,提供 Tokens 算力支持
3 小时前 / 阅读约2分钟
来源:IT之家
6月12日,华为云与MiniMax原生多模态旗舰模型M3实现开源首发适配,华为云基于昇腾算力为M3提供Tokens支持。M3在编程和智能体任务上达前沿能力,支持超长上下文,多模态输入,性能超GPT-5.5等。
感谢IT之家网友 AseKhalil 的线索投递!

IT之家 6 月 13 日消息,6 月 12 日,华为云与 MiniMax 原生多模态旗舰模型 M3 实现开源首发适配。华为云基于昇腾算力底座,为 MiniMax 提供 Tokens 算力支持

IT之家从官方介绍获悉,近日,华为云与 MiniMax 达成进一步深化合作。华为云 CloudMatrix 智算云服务已完成对其全新一代原生多模态旗舰模型 MiniMax M3 的开源首发适配。在此次合作中,华为云基于昇腾算力为 M3 提供 Tokens 支持,全面护航新模型的稳定、高效运行。

MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了 MiniMax 提出的全新注意力架构 MSA(MiniMax Sparse Attention),最高支持 1M 超长上下文。它也是一个原生多模态模型,支持图片和视频的输入,并能操作电脑桌面。

在衡量 Coding 能力的 SWE-Bench Pro 上,MiniMax M3 超过 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7。在综合评估 SVG 生成性能的基准 SVG-Bench 上,MiniMax M3 超过 Opus 4.7。

而在多模态测试集 OmniDocBench 上,MiniMax M3 得分超过 Gemini 3.1 Pro,在面向自主 Agent 的端到端评测框架 Claw-Eval 上,MiniMax M3 得到最高分。

MiniMax M3 在昇腾算力上完成 MSA 的算子适配,实现精确 KV 分块与连续访存策略,使 M3 的 Context Scaling 能力得以充分发挥。同时,M3 还在昇腾算力上完成了 MOE 均衡优化,确保各专家模块在多卡间高效协作,为 M3 的大规模推理服务提供稳定的性能支撑。