终端AI未来:成本效能优化,作为协处理器内嵌

来源:华强电子网 作者:徐涛 时间:2017-12-14 10:50

人工智能 终端 IoT

  1.1 成本效益优化,终极形态向ASIC进化

  GPU和FPGA不能满足终端大规模、低成本应用需求。目前GPU和FPGA在终端虽然落地较快,但实现成本高、功耗大,不满足大规模终端应用低功耗、低成本的场景要求。比如在安防领域,海康威视深眸双目人脸智能摄像机目前方案采用GPU模块,实现成本估算为几百元甚至高达千元,大大增加了安防摄像头成本,阻碍了AI摄像头的普及速度。如果采用FPGA方案,目前单路摄像头实现成本也需要百元以上,成本较GPU低但依旧昂贵。

  从成本和效能两个角度考虑,ASIC作为终端AI优势明显。同样以安防摄像头举例,如果未来海思等摄像头主控芯片供应商,未来在主芯片里内嵌入相关AI加速硬件IP,我们预估成本增加极有可能控制在2美元以内,能极大节约智能摄像头实现成本,加速其应用普及。

  未来:进化至ASIC是趋势,内嵌入主芯片是形态。和云端几种芯片长期共存不同,我们判断,随着AI推断算法逐步稳定,无论安防、车载、消费电子,终端AI在终端各种场景下,都将最终进化至ASIC,以AI协处理器IP的方式,嵌入融合至现有的各种移动终端主控芯片中。对主控芯片公司而言,集成AI的IP模块,能够实现进化、维持长期竞争优势。产业调研显示,苹果、高通、三星、华为、展讯等各大手机终端主芯片厂商都在各自开发专属自己的人工智能加速ASIC协处理器。此外,ARM作为老牌CPU IP提供商,也在积极开发支持AI相关运算指令集的芯片产品。9月华为发布首款内嵌人工智能专属处理器的手机主芯片(麒麟970),搭载在十月发布的Mate 10新机中,便是典型例证,也将成为未来终端人工智能ASIC发展的里程碑式事件。我们判断,华为随后同样会在其安防芯片中内嵌AI相关处理器。终端AI化普及已初现端倪。

  1.2 关注“中华崛起”与“帝国反击”

  “中华崛起”:中国公司在终端专用AI硬件架构领域未落人后。目前国内已有多家优秀的AI芯片创业型公司成立,主要包括寒武纪,地平线机器人,深鉴科技、比特大陆等。2017年8月寒武纪获得国投创业领投的1亿美元融资,并且华为9月发布的首款人工智能手机处理器也搭载寒武纪NPU。深鉴科技成立于2016年,2017年公司获得包括赛灵思在内的数千万美元投资,目前深鉴科技推出的专业处理芯片DPU在终端相比GPU性能快80%。2016年3月奇点汽车发布会上,地平线机器人首次展示了基于雨果平台的先进辅助驾驶系统(ADAS)原型系统,地平线计划将其专属ASIC处理器(BPU)集成到雨果平台之上,预计计算性能将比目前提升2-3 个数量级,并且未来地平线还将其BPU应用于智慧家居、智慧城市等多个领域。2017年比特大陆最新发布的BM1680专用芯片是其定制化的ASIC AI芯片,适用于CNN/RNN等深度学习网络模型的预测和训练计算加速,32位浮点运算性能达到4TFLOPS,其竞争目标是英伟达高端GPU产品。可以看出,国产终端专用AI硬件架构目前处于世界一级梯队,未来前景广阔。

  “帝国反击”:英伟达开源DLA阻击新兴ASIC厂商。2017年5月GTC大会英伟达CEO黄仁勋宣布,为加速深度学习技术的普及和进步,将开源其Xavier DLA(深度学习硬件加速器)供所有开发者使用、修改,争取占据终端生态平台优势。我们认为这是重要的标志性事件。标志着英伟达在终端对ASIC技术路径的认可,以及开始重视对新兴厂商的阻击。传统GPU架构的功耗限制了其在终端市场的应用,为维持其在人工智能硬件的霸主地位,英伟达把自己的ASIC技术路径和相关硬件代码开源,来应对ASIC芯片厂商的挑战。此次开源Xavier DLA,英伟达就是瞄准嵌入式和IoT等终端市场,而这也是包括寒武纪、地平线、深鉴科技、Novomind等在内的很多AI芯片创业公司重点耕耘的领域。英伟达试图利用硬件的开源共享和自己的良好生态优势,在终端继续拓展自己的帝国版图。我们认为这势必对新兴厂商造成一定程度的冲击,具体影响尚不明确,但云端巨头入局终端市场已成必然,新兴ASIC厂商将面临“看谁跑得快”的竞争新局面。(责编:振鹏)



本文为华强电子网原创,版权所有,转载需注明出处

关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志

关注方法:添加好友→搜索“华强微电子”→关注

或微信“扫一扫”二维码

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子