5月12日消息,云天励飞在投资者关系活动记录表中透露,公司正在研发的推理芯片以GPNPU架构为核心,主要技术亮点有四个方面。一是具备GPGPU级通用编程能力,针对国内芯片“易用性”难题,GPNPU架构兼容并支持迁移主流CUDA等生态,降低客户模型部署与迁移门槛;二是拥有极致能效的NPU内核,围绕推理效率与能效比深度优化,提升推理性价比;三是引入3D堆叠存储架构,可获得更高带宽与更低访问时延,突破“内存墙”,提高推理效率;四是采用算力积木架构,延续过去五年在国产工艺上的探索,利用下一代芯片构建机架级Scale-up超节点,满足万亿级乃至十万亿级MoE架构大模型的推理需求。公司希望通过该技术路线,指数级降低Token成本,推动大模型应用规模化、普惠化落地。
