IT之家 6 月 15 日消息,稀宇科技 MiniMax 在上周五(6 月 12 日)开源了 MiniMax M3 模型权重,并同步发布了 MSA(MiniMax Sparse Attention)技术论文,今日官方正式开源 MiniMax M3 模型。
据介绍,M3 是 MiniMax 的原生多模态旗舰模型,总参数 428B,激活参数 23B。M3 是第一个从 Step 0 开始做多模态混合训练的开源模型。
官方表示,发布两周以来,M3 在 Artificial Analysis 综合智能指数排行榜上取得了全球开源模型的最高排名。

针对访问量激增带来的体验问题,官方称在持续优化,目前 M3 的输出速度已从上线时的约 30 TPS 提升至约 80 TPS,接下来还会继续提速 30-40%,模型响应将更加流畅。
据介绍,MiniMax M3 在编码与智能体评测中达到“行业顶尖水平”,具备自主任务拆解、工具调用与多步推理能力,宣称写出的代码目标是直接可交付,而不是“能跑但需要人改”。

IT之家附开源链接如下:
https://huggingface.co/MiniMaxAI/MiniMax-M3
相关阅读:
《首个三项能力兼备的国产旗舰模型:MiniMax M3 发布,百万上下文、原生多模态》
