4月24日,DeepSeek-V4系列模型正式发布。为应对CSA/HCA混合注意力机制带来的新计算需求,云天励飞利用自研GPNPU架构和IFWA智能融合软件栈,通过PyTorch插件torch_ifwa,完成了面向GPNPU平台的关键机制适配验证。此次验证主要针对CSA/HCA混合注意力机制的计算特性,验证了IFWA软件栈对新型注意力结构的快速响应能力,以及GPNPU架构对前沿大模型演进的适配潜力。这一进展为后续DeepSeek-V4系列模型在GPNPU平台上的工程化部署、算子优化和性能验证奠定了基础。
