3月25日,央视新闻频道播出专题节目,深度揭秘国产大模型如何走向世界并“圈粉”全球。报道指出,坚实的算力底座是支撑大模型应用发展的关键一环。云天励飞作为国产算力领域的代表企业,在此次节目中接受了央视的采访,分享了在AI推理算力赛道的布局。

随着人工智能应用生态的演进,大模型正加速从传统的聊天式交互向更加复杂的Agent应用转变。相较于以往,Agent应用往往需要处理更长的上下文信息、执行更频繁的调用、进行更复杂的任务编排,并与外部工具、系统及数据源保持持续的协同。
这意味着,未来算力消耗的增长核心将不再局限于更大参数模型的训练,而是更多地来源于推理调用频次的激增、推理链路的拉长以及在线服务规模的不断扩大。换言之,决定大模型能否真正广泛赋能千行百业的关键所在,正逐渐从“能否训练出更大的模型”转向“能否以可承受的成本,稳定提供大规模的推理服务”。
云天励飞长期聚焦于AI推理赛道,依托深厚的技术积淀,即将推出下一代GPNPU架构芯片。该架构致力于为市场提供极具竞争力的算力选择。
新一代架构全面兼容CUDA生态,能够大幅降低客户的模型部署与迁移成本,从而实现高能效的国产算力替代。同时,该芯片充分发挥了NPU的底层特性,针对大模型推理任务进行了全方位的深度优化。此外,通过创新引入3D Memory技术,该架构成功突破了传统计算中的“内存墙”瓶颈,以更高的带宽和更低的时延,显著提升了整体推理效率。
在持续推动技术创新的同时,云天励飞的算力产品也在加速商业化落地。日前,云天励飞成功中标湛江AI推理千卡集群项目。该项目全面采用云天励飞全国产自研的推理加速卡,能够在实际应用场景中大幅提升大模型的推理效率,并有效降低整体推理成本,为区域人工智能产业发展提供坚实的算力支撑。
展望算力产业的未来发展,面向“PD分离”的前沿趋势,云天励飞已启动下一阶段的技术布局。公司计划进一步研发专为超大型计算节点设计的P芯片与D芯片。这一规划旨在为云端大模型集群推理提供具备极致性价比的算力解决方案,持续支撑人工智能产业的高效运转与创新。
