计算机视觉引爆人工智能应用场景

来源:华强电子网 作者: 时间:2017-11-08 11:03

计算机视觉 人工智能 报告

  1.1 智能驾驶生态逐渐成型

  1.1.1 实例:百度阿波罗计划

  2017 年4 月19 日上海车展上,百度总裁兼COO 陆奇宣布了阿波罗(Apollo)计划。该计划借用阿波罗登月计划的内涵,旨在打造一个完备而开放的智能驾驶软件平台,让汽车相关行业的企业能够以高效率、低成本的方式定制属于自己的智能驾驶系统。

  随着百度入局智能驾驶,该领域更加呈现出了百家争鸣的态势。根据Navigant 数据,目前伏特汽车、奔驰、谷歌、现代等众多车企或互联网企业均已涉足自动驾驶技术。在以计算机视觉为代表的人工智能技术不断成熟的背景下,智能驾驶行业会渐渐明朗,各大企业的智能驾驶生态也会逐渐成型。

  百度希望通过阿波罗计划向合作伙伴提供包括车辆、硬件、软件、数据在内的完成服务。此外,百度还会提供环境感知、路径规划等计算机视觉技术,使合作伙伴能够取得从开发到测试的完整解决方案。其中百度HMI 汽车互联网解决方案系提供了CarLife、MyCar、CoDriver、MapAuto 等多款产品。CarLife 能够让用户完成手机汽车互联,从而在驾驶过程中获得更加安全便捷的体验;MyaCar 基于车主服和车后服务等为用户提供个性化定制、安全管理的成熟解决方案;CoDriver 意图打造一个用户专属的智能语音副驾驶;MapAuto 是一套安全可靠的离线和在线地图服务。

  百度还推出了高级自动驾驶平台Road Hackers,并且宣布会对外开放基于此平台的自动驾驶训练数据。Road Hackers 采用深度学习技术实现了由前端的传感器到后端的控制系统的端到端自动驾驶。

  1.2 智能安防带来无忧用户体验

  1.2.1 实例:微软AI 摄像头

  在5 月的微软Build 2017 大会上,微软展示了一套高度智能化的摄像头监控系统。通常情况下,传统的监控摄像头主要用于实时环境查看,有功能单一、效率低下等问题。而微软借助计算机视觉技术有望改变这一现状。

  根据微软官方的展示,该套智能摄像头系统具备强大的目标识别与检测、准确的事件提醒、友好自然的人机交互。在摄像头拍摄范围内的绝大部分物体均能被系统准确地检测、跟踪和标注。在此基础上,AI 系统还能够对监控场景中的特定事件做出反馈。例如,当有危险性的工具在车间中出现摆放不当的情况时,摄像头能够准确地进行捕捉,并通过网络和移动设备将信息传达给附近的管理人员。当管理人员收到消息后,无需操作复杂的指令,而只需要以自然语言表达自己的需求,即可下达自己的管理要求。

  AI 摄像头系统可用于多种工作场景,能够为用户带来安全无忧的体验。在建筑工地等危险性较大的工作场合,系统可以及时发现建筑工人的不当操作并通知临近的工人,从而保证了施工安全;在医院中,系统能够帮助医生迅速赶到需要帮助的病人身边提供救助,防止病人出现突发状况;在企业办公场合,系统可以分辨出企业员工和外来人员,帮助企业维持日常秩序。在上述场景中,计算机视觉始终贯穿其中。随着未来视觉技术的进步,未来的生活与工作的系统中会有更多的计算机视觉集成应用。

  1.3 视觉技术活体检测实现安全加密

  1.3.1 实例:Biomio 活体检测技术

  生物特征识别是当前最有前景的身份认证技术之一。生物特征包括人脸、语音、指纹等。与传统的密码认证相比,生物特征识别技术具有安全、便捷、保密等优点。尽管如此,欺诈问题一直伴随着生物特征识别。已经有人尝试使用照片和模型等伪造的生物特征来替代真实却的生物特征,并且成功地欺骗了检测系统。为了确保生物检测的可靠性,必须保证识别对象是真实的生物体而非其他替代物,而活体检测能通过一些细微的动作或者表情变化记录独有的生物信息,从而形成活体的唯一识别标识和密码。

  创业公司Biomio 采用了与传统活体检测技术完全不同的全新技术。传统的活体检测技术包括温度、排汗、导电性、位移、呼吸、器官生理反应等。在现有的技术水平下,这些手段一直是生物特征识别系统中最薄弱的一环。Biomio 另辟蹊径,将牛津大学与Deep Mind 等机构共同开发的LipNet 深度网络运用在了生物活体检测中,并取得了独家的使用权,计算机视觉用于生物细微特征捕捉进入了新的领域。

  LipNet 使用了时空卷积、长短期记忆单元等深度学习模型,能够将不同长度的视频序列映射为文本。该模型最初用于自动读唇,在GRID 语料库上实现了93.4%的准确率。这一成绩远远超过了人类读唇者。Biomio 创造性地将读唇技术用于生物活体检测。通过要求受检测者完成特定的嘴唇动作,Biomio 可以使用读唇技术获取唇动的含义并与要求做对比,从而完成可靠的活体检测。由于读唇技术处于发展早期,并且不易受噪声信号影响,在未来较长时间内均会是一种较为安全的活体检测技术。利用以读唇为代表的一些列活体检测技术,Biomio 提供了一套完成的认证和权限控制平台,用户可以获得免密码登录、智能锁、邮件加密等多种安全服务。

  1.4 智慧医疗大幅提升诊断效率

  传统的医疗影像处理方式主要是由医务工作者基于规则和经验对影像做出诊断。因为在现实情况中存在较多不确定性,所以传统方式会存在效率低、准确率差等缺点。另外,中国还存在医疗资源分布不均、病理医生缺口较大等问题。这导致在某些地区医疗诊断问题极为严重。计算机视觉技术的进展一定程度上缓解了上述问题。高度并行化的深度学习技术能够迅速分析医疗影像资料,并给出高准确率的诊断结果。

  1.4.1 实例:Airdoc 深度学习医疗影像处理

  Airdoc 是将深度学习用于医疗诊断的代表性企业之一。公司取用大量的糖尿病视网膜病变患者眼底照片来训练了一个深度网络模型。该模型的样本使用量远超人类医生的诊断量,因此可以被看作是一位具有丰富经验的智能医生。模型对有明显症状和无明显症状的分类准确率已经能够与三甲医院的自身医生相媲美,而对糖尿病严重程度的5 分类准确率也能达到专业眼科医生的水准。

  除了诊断眼部病变外,Airdoc 还提供了皮肤、心血管、肺部等其他器官病变的诊断业务。计算机视觉技术在多器官、多病种诊断方面的优势已经逐渐展现。未来智能医疗有望成为医生诊断的重要辅助手段,甚至有望在部分领域取代人类医生。

  1.5 增强现实扩展用户交互维度

  现实增强技术(AR)通过将虚拟世界嵌套如现实世界中的方式扩展了用户的交互维度。AR 不仅能够展示现实世界中的信息,同时也将虚拟世界的信息作为补充。AR 技术在很多领域都具有广泛的应用前景。有了增强现实后,用户可以和眼中所见的一切事物发生互动,因此该技术的应用颇具想象的空间。根据智研咨询集团的预测,至2025 年AR 将会和VR 一起覆盖电子游戏、视频直播、音影娱乐等多种场景,而其软件市场规模共计超过300 亿美元。

  计算机视觉技术是支撑AR 发展的关键。在典型的AR 流程中,环境理解和3D 交互理解是关键步骤,其中会涉及到了三维配准、二维平面物体跟踪、即时定位与地图构建等多种高难度的计算机视觉技术。

  1.5.1 实例:微软HoloLens 眼镜

  微软公司于2015 年1 月22 日发布了HoloLens 头戴式增强现实设备。在2017 年上半年,此款设备正式向中国市场发售。HoloLens 是一套先进的全息影像投影装臵,同时也是一台结合了大量计算机视觉技术的可穿戴设备。

  HoloLens 融合了多种视觉传感器和光学部件,并且搭载了微软自定义的全息处理单元。因此,HoloLens 能够实时运算大量来自传感器的数据,做到理解用户的手势和视线,并映射用户所处的周围环境。用户能够使用HoloLens 将物理世界和数字世界中的事物融为一体,并轻松地与数字世界发生交互。增强现实的组成形式有基于显示器式、光学透视式和视频透视式。HoloLens 以全息投影的方式实现增强现实,属于光学透视式。此种形式的增强现实分辨率高且无视觉偏差,因此用户体验比基于显示器式和视频透视式更好。同时,这种形式的设备也对计算机视觉技术的要求更高,设备制造商需要攻克精确定位、延迟匹配、拓宽视野等技术难题。

  HoloLens 提供的功能十分广泛,并且随着开发版设备的发售和SDK 的开放下载,未来HoloLens 的功能覆盖面仍会进一步扩展。HoloLens 的无线便携设计和舒适的佩戴体验更让用户可以在多数场景使用HoloLens。根据微软已经公开的信息,HoloLens 首批应用程序包括了混合现实游戏RoboRaid、旅游应用HoloTour、建模工具HoloStudio、视频工具Actiongram 等。用户利用HoloLens 可以实现收看新闻、游戏娱乐、教学、科研等多种功能。



本文为华强电子网原创,版权所有,转载需注明出处

关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志

关注方法:添加好友→搜索“华强微电子”→关注

或微信“扫一扫”二维码

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子