MiniMax M3 模型正式开源:原生多模态、百万上下文
3 小时前 / 阅读约2分钟
来源:IT之家
稀宇科技MiniMax开源原生多模态旗舰模型M3,总参数428B,激活参数23B,采用MSA架构,在Artificial Analysis综合智能指数排行榜上取得全球开源模型最高排名,输出速度提升至约80TPS。

IT之家 6 月 15 日消息,稀宇科技 MiniMax 在上周五(6 月 12 日)开源了 MiniMax M3 模型权重,并同步发布了 MSA(MiniMax Sparse Attention)技术论文,今日官方正式开源 MiniMax M3 模型

据介绍,M3 是 MiniMax 的原生多模态旗舰模型,总参数 428B,激活参数 23B。M3 是第一个从 Step 0 开始做多模态混合训练的开源模型。

官方表示,发布两周以来,M3 在 Artificial Analysis 综合智能指数排行榜上取得了全球开源模型的最高排名。

针对访问量激增带来的体验问题,官方称在持续优化,目前 M3 的输出速度已从上线时的约 30 TPS 提升至约 80 TPS,接下来还会继续提速 30-40%,模型响应将更加流畅。

据介绍,MiniMax M3 在编码与智能体评测中达到“行业顶尖水平”,具备自主任务拆解、工具调用与多步推理能力,宣称写出的代码目标是直接可交付,而不是“能跑但需要人改”。

IT之家附开源链接如下:

https://huggingface.co/MiniMaxAI/MiniMax-M3

相关阅读:

  • 《首个三项能力兼备的国产旗舰模型:MiniMax M3 发布,百万上下文、原生多模态》