寒武纪完成DeepSeek-V4“Day 0”适配
2 小时前

4月24日,寒武纪宣布已基于自研NeuWare软件生态与vLLM推理框架,完成对深度求索公司最新开源大模型DeepSeek-V4的“Day 0”适配,适配代码已同步开源至GitHub社区。寒武纪通过自研高性能融合算子库Torch-MLU-Ops对Compressor、mHC等模块专项加速,利用BangC编程语言编写极致优化Kernel,充分释放硬件底层性能。DeepSeek-V4预览版同步上线并开源,拥有百万字超长上下文,Agent能力与推理性能表现突出。此外,海光DCU也同步完成了对DeepSeek V4的Day0适配。