摩尔线程MTT S5000完成对DeepSeek-V4-Flash适配 - AI - JQman

Just Quick Just Quality

热门话题

白天

搜索

/

/

资讯

/

/

摩尔线程MTT S5000完成对DeepSeek-V4-Flash适配

2026-04-24

4月24日，摩尔线程联合智源众智FlagOS社区，在旗舰级AI训推一体GPU MTT S5000上，完成对新一代大模型DeepSeek-V4-Flash的Day-0适配，并实现全量核心算子深度优化与部署支持。DeepSeek-V4-Flash采用MoE架构，总参数284B，支持百万Token上下文，首次采用FP4+FP8混合精度。MTT S5000作为国内率先原生支持FP8的全功能GPU，通过硬件级FP8 Tensor Core，将显存压力降低50%，计算吞吐量翻倍。适配过程中，团队聚焦FP8算子与Sparse Attention算子，通过编译优化与自动调优，使TTFT时延降低16.5%，ITL时延降低39.7%，吞吐量提升65.7%。目前，双方正推进1.6T旗舰模型DeepSeek-V4-Pro在MTT S5000上的迁移适配工作。

上一篇：寒武纪完成DeepSeek-V4“Day 0”适配

下一篇：AI大事件汇总（04月24日）

2 天前

梁文锋，不想做大哥

2 天前

AMD年度AI大会直击：Zen6出鞘2nmGPU首秀还有“地表最强”AI机架！剑指万亿市场

2 天前

Claude Opus5偷跑，第一波网友实测来了

1 天前

特斯拉一周跌没18%，马斯克自嘲回应财富急速缩水

2 天前

一年暴涨100倍，AI最被低估的生意爆发了

2 天前

消息称苹果为消化内存涨价，提议下调 iPhone 18 Pro / Max 的 OLED 面板采购价

2 天前

黄仁勋站在 AI 产业的十字路口呐喊：力挺开源

2 天前

赛马结束，大厂各寻Agent主心骨

2 天前

大模型价格战下半场：将推理价格打下去

2 天前

Token 调用量涨 6 倍！华为：运力成 AI 算力最大瓶颈，不该执着单芯片制程

上一篇：寒武纪完成DeepSeek-V4“Day 0”适配

下一篇：AI大事件汇总（04月24日）

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们