曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%
6 天前

国产GPU厂商曦望近日发布新一代推理GPU芯片启望S3,这是其在近一年累计完成约30亿元战略融资后的首次公开亮相。启望S3是专为大模型推理设计的定制化GPGPU芯片,在典型推理场景下,其整体性价比较上一代提升超10倍,支持FP16至FP4精度切换,显存容量增加4倍。在主流大模型推理场景中,单位Token成本降低约90%。此外,曦望还发布了寰望SC3-256超节点方案,联合生态伙伴推出推理成本计划,并与浙江大学签署了战略合作协议。曦望前身为商汤科技大芯片部门,至2025年,其芯片交付量已突破万片。