摩尔线程携手智源 FlagOS，为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

摩尔线程携手智源 FlagOS，为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配

2026-04-24 / 阅读约2分钟

来源：IT之家

摩尔线程携手智源FlagOS，为MTT S5000完成DeepSeek-V4-Flash模型Day-0适配。该模型采用混合专家架构，首次采用“FP4+FP8”混合精度策略。摩尔线程原生FP8支持能力，可高效承载前沿精度设计。

感谢IT之家网友菜鸟N号的线索投递！

IT之家 4 月 24 日消息，摩尔线程今天携手智源 FlagOS，为旗舰级 AI 训推一体全功能 GPU MTT S5000 完成 DeepSeek-V4-Flash 模型 Day-0 适配。

据介绍，DeepSeek-V4-Flash 模型采用混合专家（MoE）架构，总参数量达 284B，激活参数 13B，支持百万 token（词元）上下文长度。预训练数据超 32Ttoken，在最大推理力度模式（Flash-Max）下推理能力逼近 Pro 版本。

值得注意的是，DeepSeek-V4 模型首次采用了“FP4+FP8”混合精度策略，而国内当前主流 AI 芯片仍普遍以 BF16 为主。摩尔线程凭借原生 FP8 支持能力，可更高效承载 DeepSeek-V4 的前沿精度设计。

同时，MTT S5000 GPU 内置硬件级 FP8 Tensor Core 加速单元，相比传统 BF16/FP16 能将数据位宽直接减半，显存带宽压力降低 50%，理论计算吞吐量实现翻倍。

为充分发挥 MTT S5000 的 FP8 优势，FlagOS 团队为 DeepSeek-V4 模型进行 FP8 量化。通过系统级分析，双方技术团队将本次适配的攻坚重点锁定在 FP8 算子与 Sparse Attention 算子，在“编译优化”与“自动调优”两大方向取得重大突破。

综合IT之家此前报道，摩尔线程已多次 Day-0 即时适配国产大模型，涵盖 MiniMax M2.7、智谱 GLM-5 等

上一篇：Infosys 宣布与 OpenAI 战略合作，加速企业 AI 转型，规模化释放 AI 价值

下一篇：实测GPT-Image-2，我们正在集体失去“看见真相”的能力

返回列表

热文阅读

2 天前

英伟达MoE新开源：一行import，微调加速3.7倍

2 天前

DeepSeek深夜发文：开启大规模“抢人”

1 天前

江西赣州被英伟达盯上，连夜搬走黑石头

2 天前

OpenAI最新报告：Codex取代ChatGPT，大神让“Agent团队”干活

2 天前

豆包被迫收费养家，反而拉高了「DAA」的能见度

2 天前

GPT-5.6紧急叫停，OpenAI最强模型被迫「一客一审」

1 天前

不到半年，已上市550款新车？

1 天前

G7易流发布货运行业首款穿戴式AI硬件「拍拍豆」，填平物流交付的“最后两米”｜最前线

1 天前

刚刚，DeepSeek V4更新DSpark，推理速度提升80%

2 天前

对话张亚勤：AI不是泡沫，但AI公司有泡沫

上一篇：Infosys 宣布与 OpenAI 战略合作，加速企业 AI 转型，规模化释放 AI 价值

下一篇：实测GPT-Image-2，我们正在集体失去“看见真相”的能力

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们