安谋科技Arm China发布 “周易” X3 NPU,端侧 AI 算力实现10倍跃迁

来源:安谋科技 作者: 时间:2025-11-18 10:46

安谋科技 AI

2025 年 11 月 13 日,国内芯片 IP 领域迎来重磅突破 —— 领先的芯片 IP 设计与服务提供商安谋科技(中国)有限公司在上海正式发布 “周易” X3 NPU IP 新品。作为公司 “All in AI” 产品战略的首款核心落地成果,这款基于最新 DSP+DSA 架构的芯片 IP,以 8-80 FP8 TFLOPS 灵活算力、256GB/s 单 Core 超高带宽等硬核参数,将端侧 AIGC 大模型能力提升 10 倍,一举破解端侧大模型运行的算力、带宽、开发门槛等行业痛点,为基础设施、智能汽车、移动终端、智能物联网四大领域注入强劲 AI 动力。

 

image.png 

安谋科技Arm China产品研发副总裁刘浩

 

 

安谋科技产品研发副总裁刘浩在发布会上明确表示,公司将持续整合顶尖研发资源,秉持开放合作理念,通过 “硬件 + 软件 + 服务” 端到端解决方案,全力赋能生态伙伴的产品创新与商业化落地。此次 “周易” X3 的发布,标志着安谋科技 “AI Arm CHINA” 战略进入实质性落地阶段,也为国内 “AI+” 产业升级筑牢智能计算基石。

image.png 

“周易”X3 NPU IP新品发布会现场

 

性能突破:端侧大模型运行效率刷新行业纪录

针对当前端侧设备 AI 算力受限、带宽不足等核心难题,“周易” X3 进行了全方位技术革新。其采用兼顾 CNN 与 Transformer 的通用架构,完成从定点到浮点计算的关键转变,单 Cluster 最高支持 4 个 Core,算力覆盖 8-80 FP8 TFLOPS,可灵活适配不同场景需求。相较于上一代产品,其 CNN 模型性能提升 30%-50%,多核算力线性度达 70%-80%,而 AIGC 大模型能力更是实现 10 倍飞跃。

 

在关键场景实测中,“周易” X3 表现尤为亮眼。Llama2 7B 大模型测试显示,其 Prefill 阶段算力利用率高达 72%,配合自研解压硬件 WDC,Decode 阶段有效带宽利用率超 100%,远超行业平均水平。同时,WDC 技术还能让大模型 Weight 经无损压缩后获得 15%-20% 等效带宽提升,新增的 W4A8/W4A16 计算加速模式则通过低比特量化,大幅降低带宽消耗,助力云端大模型向端侧高效迁移。此外,该产品支持 int4 至 fp32 多精度融合计算,搭配 AI 专属硬件引擎 AIFF,可实现 0.5% 超低 CPU 负载,完美适配多任务与高优先级调度场景。

image.png 

“周易”X3 NPU IP新品亮点

 

软硬协同:开源平台让 AI 开发门槛大幅降低

“周易” X3 的领先优势不止于硬件,配套的 “周易” Compass AI 软件平台构建了 “软硬一体” 的高效开发生态。平台集成神经网络编译器、大模型运行工具等核心组件,支持超 160 种算子与 270 种模型,兼容 TensorFlow、PyTorch、Hugging Face 等主流 AI 框架,提供开箱即用的 Model Zoo。其中,Hugging Face 模型 “一键部署” 功能可实现模型 “一站式” 转化与部署,显著降低开发门槛。

 

为进一步赋能开发者,安谋科技已将平台核心组件开源,提供丰富调试工具与 Bit 精度软件仿真平台,支持自定义算子开发与专属模型编译器打造。同时,平台支持 Tensor/Channel/Token Level 及 GPTQ 等多样量化方式,适配 LLM/VLM/VLA 及 MoE 等前沿模型,实现云到端快速迁移,破解端侧 AI 开发 “适配难、周期长” 的行业痛点。

 

image.png 

“周易”NPU Compass AI软件平台

 

 

全场景落地:四大领域覆盖百余种 AI 设备

凭借强大的兼容性与适配能力,“周易” X3 将端侧智能拓展至更广阔的应用场景。在基础设施领域,可为数据中心及边缘计算节点提供 AI 模型加速支持;智能汽车领域中,同时赋能 ADAS 辅助驾驶与智能座舱交互,支撑自动泊车、语音互动等功能;移动终端领域,让 AI PC、AI 手机实现超分渲染、AI Agent 等高级应用;智能物联网领域,则为智能网关、智能 IPC 等设备提供本地 AI 推理能力,兼顾实时性与隐私保护。

image.png 

“周易”NPU IP系列家族现场demo展示区

 

 

发布会上,安谋科技还展示了 “周易” NPU 产品家族的完整演进路径。从赋能 AIoT 场景的 Z1 系列,到支持高端终端的 X1、X2 系列,再到此次发布的 X3,产品算力梯度覆盖 0.32 TOPS 至 80 FP8 TFLOPS,形成全场景覆盖能力。现场演示中,“周易” X3 运行的文生文对话、文生图、多模态识别等应用,充分展现了其在复杂认知场景的优异性能,印证了端侧 AI 从单一功能向 “全民普及” 的转型趋势。



关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读

关注方法:添加好友→搜索“华强微电子”→关注

或微信“扫一扫”二维码

华强微电子

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子