安谋科技发布“周易”X3 NPU IP,打造端侧AI计算效率新标杆
3 小时前 / 阅读约5分钟
来源:集微网
安谋科技推出新一代NPU IP“周易”X3,采用DSP+DSA架构,兼容CNN与Transformer,搭载Compass AI软件平台,覆盖四大领域,提升AI计算效率。

2025年11月13日,安谋科技在上海举行新品发布会,正式推出新一代NPU IP——“周易”X3,该产品采用专为大模型而生的最新DSP+DSA架构,兼顾CNN与Transformer,协同完善易用的“周易”NPU Compass AI软件平台,致力于为基础设施、智能汽车、移动终端、智能物联网四大领域提供AI计算核芯,打造端侧AI计算效率新标杆,加快边缘及端侧AI规模化部署。


图1:“周易”X3 NPU IP亮点

硬件架构:专为大模型设计最新DSP+DSA架构

“周易”X3基于专为大模型设计的最新DSP+DSA架构,从定点转向浮点计算,单Cluster拥有8-80 FP8 TFLOPS算力且可灵活配置,单Core带宽高达256GB/s,支持端侧大模型运行必备的W4A8/W4A16计算加速模式,集成安谋科技自研的解压硬件WDC,使大模型Weight软件无损压缩后通过硬件解压获得额外约15%的等效带宽,计算效率和计算密度大幅提升。

同时,“周易”X3集成AI专属硬件引擎AIFF,配合专用硬化调度器,实现超低至0.5%的CPU负载与低调度延迟,使NPU在并行处理多项AI任务时,拥有高效流畅的体验。

软件生态:优化大模型端到端性能,支持客户自定义AI开发

“周易”X3 搭载完善易用的Compass AI软件平台,全面优化大模型端到端性能。平台广泛兼容TensorFlow、ONNX、PyTorch等主流AI框架,具备业界领先的大模型动态Shape支持能力,并支持GPTQ等大模型主流量化方案、 Hugging Face模型库,与LLM、VLM、VLA及MoE等模型。

 图 2:“周易”NPU Compass AI软件平台

同时,安谋科技积极构建开放生态,Compass AI软件平台已将 Parser、Optimizer、Linux Driver、TVM 及内部 IR 格式等核心组件相继开源,并拥有丰富的调试工具,可满足开发者白盒部署需求,且支持更易用的 DSL 算子编程语言,在深度开发模式下,客户可以使用平台中的Compiler、Debugger和DSL语言开发出自己的自定义算子,也可通过Parser、Optimizer等工具打造出属于自己的模型编译器,极大提升开发效率。发布初期,“周易”Compass AI软件平台已支持超 160 种算子与 270 多种模型,显著提升开发部署效率,助力客户快速实现 AI 应用创新与落地。

软硬深度协同下,“周易”X3的性能显著提升, CNN模型性能较上一代提升30%-50%,在同算力规格下,AIGC大模型能力提升10倍,这得益于16倍的FP16 TFLOPS、4倍的计算核心带宽,以及超10倍的Softmax和LayerNorm性能提升共同驱动。实测多核算力线性度达到70%-80%。实测大模型性能方面,“周易”X3 在Prefill阶段算力利用率达72%,Decode阶段有效带宽利用率在开启WDC情况下超100%,充分释放硬件算力潜力。

应用场景:覆盖基础设施、智能汽车、移动终端、智能物联网四大领域

在应用场景上,“周易”X3可广泛应用于加速卡、智能座舱、ADAS、具身智能、AI PC、AI手机、智能网关、智能IPC等AI设备,深度赋能四大核心领域,提升AI计算效率,优化AI应用体验。

  •  基础设施:在加速卡场景中,支持CNN与大模型等多样结构的AI模型加速;

  •  智能汽车:在ADAS系统中,可基于AI算力进行为自动泊车等辅助驾驶提供AI算力支持;在IVI系统中,支持基于语音与车内外视频图像输入的智能互动;

  •  移动终端:在AI PC、AI手机上,可实现超分渲染,提升分辨率,并支持基于大模型的AI Agent应用;

  •  智能物联网:在智能网关、智能IPC等设备中,提供本地AI推理能力,提升响应速度,优化智能体验。

周易“X3”的推出,进一步完善了安谋科技NPU IP产品家族在端侧AI领域的布局。目前,“周易”NPU产品线已全面覆盖核心领域,可匹配多场景AI计算需求。未来,安谋科技将积极响应“AI+”行动计划,深耕技术创新,连接全球前沿技术,携手伙伴共建生态,为国内“AI+”产业升级构建坚实的智能计算基石。