2019生物识别技术论坛:行业大咖齐聚一堂,探讨生物识别新风口

来源:华强电子网 作者:Hobby 时间:2019-09-24 18:08

生物识别 深度学习 虹膜识别 指纹识别 声纹识别 人脸识别

9月22日,由芯智讯主办的2019生物识别技术与应用高峰论坛在深圳科兴科学园正式拉开帷幕。随着智能手机、移动支付、智慧安防以及智能家居等产业的高速发展,诸如指纹识别、人脸识别、语音识别等生物识别技术正迎来了发展良机,越多越多的生物识别技术正被广泛应用到各大商业、政企、消费类市场中。而如今伴随着应用需求的提高,市场对于生物识别技术的安全性、识别速度、准确性、成本等都提出了更高的要求。

                                              vbox8154_WMZ_3828_143938_small.JPG

本次高峰论坛以“融合·创新”为主题,邀请到了从业人脸识别、语音(声纹)识别、指纹识别、眼球追踪、虹膜识别等众多生物识别技术领域的知名企业和技术专家,包括中科院深圳先进技术研究院数字所所长乔宇、中国科学院深圳先进技术研究院集成所研究员陈巍、声扬科技首席科学家张伟彬博士、英特尔实感产品事业部中国区销售总监何火高、七鑫易维手机业务部产品总监孔祥晖、小优智能科技副总经理代启强、嘉楠科技销售总裁蔡博、中科虹霸移动业务商务总监陈桦以及思立微高级产品经理孙云刚,共同推进生物识别新技术的交流与落地,探讨生物识别技术未来的发展方向。

 

深度学习推进人脸识别技术快速进步

vbox8154_WMZ_3857_145108_small.JPG

自2006年深度学习网络被突破,2011年深度学习帮助语音识别取得重要进展,紧接其后,云计算、人脸识别、围棋、机器翻译等都有着显著进展,这些都无一不体现着深度学习对人工智能等项目起到的重要推进作用。

 

中科院深圳先进技术研究院数字所所长乔宇举了一个例子:在计算机视觉实践过程中有一个影响非常大的竞赛叫ImageNet,这个比赛内容是从包含1000个类别的100万张图像中,随机抽取一张图像,由机器分辨出图像中内容属于1000个类别中的哪一种。过去五年间这个性能得到非常大的提升,最初两年使用提取局部特征的方法错误率在25%左右。2012年加拿大多伦多大学教授首次把深度学习方法引入,一下把错误率降低10%。这是一个非常重要的里程碑。直到2015年已经把错误率降低到3.5%,而人的错误率在5.1%,这个水平已经高于人类。

 

而回归到人脸识别,它主要由两个任务组成:一是1:1人脸比对,比如在高铁站的场景中,现场对比人与身份证中的照片,分辨是否同一人。二是1:N比对,这是动态人脸识别,比如在监控条件下有一张人脸照片,跟公安敏感数据库里的人进行比对,判断这是不是在逃的嫌疑犯,显然后者任务更难。

 

除了1:1与1:N人脸识别的任务,乔宇博士表示,视频也是他们的主要方向。Facebook首席科学家认为,人脸识别最核心的问题就是解决视频。2015年乔宇博士团队将传统方法的经验和深度学习模式相结合,一下子将识别率提到91%,这是UCF101首次大于90%的性能。而乔宇博士团队在背后做的另一个工作——时序分割模型,解决了端到端的深度学习网络训练。众所周知深度学习需要大量显存与运算量,所以他们把视频产量和深度网络训练在一起完成,最终这项技术获得行为识别领域Activity2016的第一名。后面被多企业广泛使用,被引用超过900次。

 

深度学习伴随大数据的应用,性能在不断提升。但事实上,深度学习仍存在局限性。乔宇博士表示:“很多数据是不规则、不完全,可能是异构多态,可以看到深度学习面临很大的瓶颈。另一方面我们知道深度学习往往靠能力技术扩张,利用推理的能力很差,不会复用生活中的很多常识和知识。深度学习会犯愚蠢的错误,这是为什么现在自动驾驶这种对精度要求非常高,复杂场景比较多的都不能用。现在很多深度模型很多是黑箱的,其可靠性、可解决性比较差,对于很多应用,我们不仅要告诉病人、医生诊断的结果,要告诉我到底依据什么依据做结果,我们合理建议,这是重要的方面。”

 

另一方面,深度学习的鲁棒性和泛化能力有很大的缺陷,比如将一只小狗随意改变像素,机器可能就会将它判断为另一个类别。再比如将一只猴子放在摩托车上,机器很可能会将猴子判断为人,因为数据库中的照片大量是人在摩托车上面。因此,如果将社会、信息体系建立在大量深度模型这么脆弱的情况下是非常可怕的。乔宇博士还表示,从研究的角度来讲,他们目前开展很多工作来解决这样的问题。

 

英特尔RealSense+Movidius AI联手小钴科技进军智能门锁市场

vbox8154_WMZ_3944_151523_small.JPG

 

据英特尔实感产品事业部中国区销售总监何火高介绍,英特尔Realsense自2012年收购了两家公司开始,就开始在深度领域进行投入。从目前英特尔的产品线路图中,我们可以看出,英特尔有结构光产品SR300系列,还有双目D400系列。众所周知,3D视觉有三个技术方向:结构光、双目和飞行时间ToF。对于英特尔而言,他们认为,双目3D摄像头由于在检测距离上有着较大的范围,因此它的适用场景会更为广泛。从技术的角度看,英特尔认为双目非常有发展前景。

 

不过英特尔看好双目的同时,也在开辟新的技术。何火高透露,英特尔将会在今年年底到明年年初CES时会发布TOF的产品L515,是业界少有低成本的LiDAR解决方案,这将会是非常震撼的产品。而在其他的如位置跟踪领域,英特尔也推出了新产品T256,主要面向AR/VR市场,以及机器人、无人机等方面的应用。

 

从英特尔实感技术组合来看,何火高表示,英特尔在三种不同的技术方向都有深入投入,耕耘了很长时间,积累了很多经验,不断优化产品以及组合。而英特尔的产品线也是非常独特的,他们拥有从最小、最初的传感器端一直到最终云端的全系列解决方案。与此同时,英特尔还是全球少数深度摄像头出货量超百万的公司,英特尔在产品的一致性、稳定性、可靠性都有着非常大的信心。

 

值得一提的是,英特尔还具有人脸识别的算法。在现场,何火高还表示英特尔RealSense加上Movidius AI=完美智能锁的方案。而目前英特尔已经与合作伙伴小钴科技推出了首款利用这套方案的智能门锁,据小钴科技CEO陈俊逸介绍,这款3D人脸识别智能门锁样品基于小钴科技与英特尔合作推出的3D人脸识别智能门锁模组AlpaLook 3D,其3D深度信息不仅仅用来做活体防伪,更将人脸的深度信息即鼻梁高度、嘴唇厚度等特征,转化为人脸特征,有效防止电子照片、电子视频、3D硅胶面具等伪装攻击,误识率达到百万分之一,相比目前常见的指纹门锁和2D人脸识别门锁,能够带来更高的安全性和便利性。

 

声纹识别将开启生物识别新风口

vbox8154_WMZ_3996_153221_small.JPG

 

在生物识别技术上,人们最为熟悉的应该就是指纹识别和人脸、虹膜识别了,而声纹识别是近年才兴起的,相比于其他的生物识别技术,声纹识别有着针对性的应用领域。声扬科技首席科学家张伟彬博士表示,他们将声纹识别称之为技术的新风口,主要有几方面的因数。

 

一是国家政策的支持,去年10月份左右央行发布了声纹识别技术在移动金融上的应用标准。这是在国家层面、政策层面承认声纹识别技术达到应用门槛,可以满足金融高安全需求的应用。

 

第二,这几年我国电信诈骗比较猖獗,电信诈骗唯一能协助破案的生物识别技术是声纹识别,需求在这一两年爆发。

 

第三,作为一个技术,声纹识别其实已经有几十年的历史。而近年的AI技术突飞猛进,驱动声纹识别技术达到成熟的阶段。

 

在谈到技术方面,张博士表示声纹识别可以分为三个阶段。

 

 

第一阶段,基于模板匹配的方法,像人脸一样要先做注册,再做验证,注册时说的内容要和验证时是一样的,只是比较这两个声音像不像。

 

第二阶段,基于概率模型。声音有时间的长度,长度是可长可短,有的人说话快,有的人说话慢,首先要把可变长度的向量变成物理程度,这是基于高斯模型概率统计的。识别率勉强达到95%的概率,不过95%在很多应用场景是达不到的,要考虑噪声、干扰的影响。

 

第三阶段,2012年左右深度学习在很多方面带来爆发性的影响,其中在声纹领域,最近比较大的事件是2017年有一个比较好的方法把这个东西用在声纹识别领域,这带来很大的提升。

 

在声纹识别领域已经耕耘多年的声扬科技,技术上也必然有过人之处。据张博士介绍,声纹跟内容、语言无关,技术上要做到跟内容、语言、文本无关是非常大的挑战。声纹识别除了模仿外,如何防止录音破解认证也是一个非常大的挑战。而早期声纹十倍需要用户说几分钟的语音,而声扬科技目前可以做到只需要8个中文数字就可以完成准确率很高的声纹验证。

 

另外,不同录音设备下的录音差异其实非常大,做声纹识别需要克服不同麦克风信道带来的差异。而目前做声纹比对的数据库规模并不够大,理论上亿级数据库的检索才能获得最准确的识别,但目前最大的声纹库可能在百万级别的规模。

 

张博士补充道,除了以上所说的技术优势,对于他们团队来说还有一个很大的优势是,他们技术上不是只有声纹识别,还要做语音信号处理,如语音降噪,使得输入声纹识别系统的声音更加干净。另外声扬有自己的语音识别技术,通过多种技术的组合可以打造成完整的符合客户要求的解决方案。这是声扬科技的竞争优势之一。

 

在应用落地方面,张博士透露,声扬科技在印尼参与了国家级社保项目,覆盖了250万公务退休人员,而声纹识别实际表现准确率达到了99.7%。并且声扬科技在今年参加了很多银行基于声纹的POC测试,大部都排在第一名。截止目前声扬科技大概服务了全球超过5000万人口,比如印尼和墨西哥的银行。

 

3D高精度人脸扫描在美容微整形领域大有可为

vbox8154_WMZ_4023_154344_small.JPG

3D视觉的应用十分广泛,在2019生物识别技术与应用高峰论坛上,小优科技就带来了他们在美容微整形领域的一些经验。

 

据小优智能副总经理代启强介绍,小优科技的业务很大一部分在人脸识别上,但近年来,他们在其他应用行业中做了一些探索。根据报告显示,截至2018年,美容行业市场规模达到4953亿人民币,增长率逐年提高。随着应用的发展,人们对美容的关心超乎寻常,这时候传统模式下对于美容之路的形象属于想象和手绘图的方式确定,这时候需要一种设备,可以方便快捷采集人脸真实数据,通过对数据的虚拟化改动,让顾客看到自己术后的模样,提高顾客信息,增加手术满意率。

 

对于传统医疗用3D扫描,代启强认为存在着下面四个问题:

第一,数据不准确,无法采集精确人脸数据,无法掌握顾客原始人脸数据。

第二,现有三维扫描装备体积大,不易携带。

第三,现有设备用TI投影光机,成本高。

第四,设备投射强光,需要顾客闭眼,会影响顾客后续的效果。

 

代启强补充道:“我们认为设备要最大限度符合原始人脸数据;体积更小,方便操作;设备性价比高;方便集成。”那么对于以上的这些问题,要怎么解决呢?

 

小优科技采用成熟的相移动态结构光技术采集人脸信息;使用MEMS技术实现投影设备微型化;提供丰富SDK接口供美容相关企业使用。通过投射正弦结构光,利用MEMS技术将点光源变成线光源放大扩散出去,利用高频激光器工作原理对它进行拖拽,控制生成有效的、有编码的动态正弦线结构光图案对人脸进行数字化,对每个人的脸部数据进行调整,展示自己个性化的一面,过程是可视化的。顾客可以通过调整直观看到术前术后的对比。

 

 

思立微推CSM&UTM指纹识别技术,首次曝光自研LCD屏下指纹识别方案

vbox8154_WMZ_4073_155839_small.JPG

在手机指纹传感器市场,思立微目前出货量是全球前三,覆盖了所有手机能应用到的电容指纹识别方案,从正面、侧面、背面的全系列产品都一应俱全。但随着手机全面屏的大潮席卷市场,屏下指纹的需求持续提高,而思立微在屏下光学指纹领域也是处于世界TOP2,仅此于汇顶。在2019生物识别技术与应用高峰论坛撒花姑娘,思立微高级产品经理孙云刚便向我们展示了思立微在指纹识别领域的最新解决方案。

 

在5G时代,移动终端设备对于电池的需求更高,手机内部空间也显得更为珍贵。思立微便针对5G开发出新一代指纹识别模组——CSM。孙云刚表示,CSM是基于7001芯片上开发的模组,这个模组通过封装创新设计达到空间占比的下降。目前思立微CSM模组相比COB模组在整个模组段,可以在SY方向面积下降50%,不仅如此,采用CSM模组还可以把传统COB方案的区域直接去掉,可以用封装工艺封装到模组里,可以有效为电池让出一些设计空间。

 

同样是为了节省设备内部空间,思立微还推出了UTM超薄指纹识别模块,目前做到0.4毫米内,相比传统的CCM方案可以下降80%的高度。感应区面积是54平方毫米,提供高解析率。UTM方案固定在中框上,可以跟OLED进行解耦,不存在贴屏和拆屏的损失。

 

除此以外,思立微还首次曝光了自家的LCD屏下指纹方案——7601A。众所周知OLED因为其本身自发光的特性,面板厚度小,易透光。因此目前大部分屏下光学指纹方案只适用于OLED屏幕。而LCD屏幕本身结构复杂,透光性差,于是目前各大厂家的方案大多采用了红外光。思立微在采用红外光的同时,还通过自主IC设计和工艺的开发来设计出高响应指纹识别芯片。孙云刚表示,目前的方案和技术均已准备好,现在与终端探讨项目上的进展。

 

最后,孙云刚还补充道,除了光学与电容指纹识别方案外,超声方案也是在我们的产品规划当中,目前已经产出样品,正在处于内部验证阶段,可能明年就可以正式商用。

 

 

虹膜识别技术的挑战与未来

生物识别现在比较成熟的有包括指纹、人脸、掌型、掌纹、声音和虹膜。指纹和人脸随着iPhone革新的产品出现,包括iPhoneX结构光带动指纹、人脸的普及,最大的好处是易用,指纹不需要任何培训,人脸也是,抬起手机就能开锁。而虹膜识别似乎并没有像指纹、人脸识别等被广泛应用,除了在手机上如三星s系列上有部分应用外,消费者日常很难接触到虹膜识别这项技术。

vbox8154_WMZ_4161_163101_small.JPG

相比其他的生物识别技术,虹膜有什么优势?中国科学院深圳先进技术研究院集成所研究员陈巍表示,首先,虹膜是我们眼睛里巩膜和瞳孔这一圈,特别是东亚人的眼睛,难以分辨虹膜和眼睛,因此相对而言,东亚人的虹膜信息更加安全。虹膜识别技术和指纹识别、人脸识别等技术没两样,通过图象识别拍摄你的虹膜去编码、比对,再通过虹膜识别比对。但虹膜比其他生物体征要精准得多,因为它的特征点比人脸多得多,地球上有10的72次方的人才有两个相似的虹膜,用一个数据去对比,一年掉落地球雪片总数10的23次方。而且人左眼和右眼的虹膜不一样。3岁之后虹膜不再改变。

vbox8154_WMZ_4338_173152_small.JPG

中科虹霸移动业务市场总监陈桦则表示,虹膜还具有非常强的生物活性,比如瞳孔的大小会随光线强弱变化,视物时有不自觉的调节过程,有每秒可达十余次的无意识瞳孔缩放,这也使得虹膜也会发生每秒十余次的震颤;此外,在人体脑死亡、处于深度昏迷状态或眼球组织脱离人体时,虹膜组织即完全收缩,出现散瞳现象。这些特性也使得虹膜具有极高的防伪性。

 

从这几个角度来讲,虹膜作为稳定的生物识别特征相比人脸更灵敏,相比指纹识别在日常中有更大的优势。

 

另一方面,在安全问题上,人脸识别有可能通过伪装破解,年龄的变化也会使得人脸数据产生变化,而指纹信息容易泄露。虹膜信息本身就难以获取,而且非接触性的性质,对于中东地区人民十分适用。

 

但陈巍也坦言,对于大部分普通消费者来说,接触虹膜识别的机会少之又少。归结原因主要有三点:

 

一、我国虹膜识别产业不太成熟,国家标准有一个很简单的标准,现在行业标准还没有很好的行业标准。

 

二、虹膜识别设备相比指纹、人脸,除了不好用以外,还贵。

 

三、虹膜采集技术还待发展,所有决定市场最终除了价格,另一点是用户体验。

 

陈巍还表示,他们目前在提升用户体验上做很多工作,像实现虹膜的少配合或者无配合的情况下完成任务。“我们在远距离虹膜,比如60-100厘米范围内做方案。这是我们第一代产品,我们可以在不同的身高需要微微低头就能实现快速虹膜识别。到今天我们形成了全系列产品的Demo,包括我们做的类似VR眼镜虹膜采集设备,我们在安卓端、门禁、门锁都有应用。”

 

陈桦表示,印度全民身份认证、阿联酋出入境系统,国内的400多家矿山,包括神华集团、中煤集团、同煤集团等特大型煤炭企业所采用的虹膜识别系统都是基于中科虹霸的技术。中科虹霸还主导参与了中国所有涉及虹膜方面的国家标准和行业标准的制定,为虹膜信息采集、建库、应用规范奠定了基础。

 

目前中科虹霸有三大类产品:移动设备、安防设备和车载设备。在2016年开始,中科虹霸与国内多家手机和移动设备厂商合作,已经推出了十几款移动虹膜设备和手机。同时智能门锁也是已经量产的虹膜技术应用。

 

眼动追踪应用活体检测,与虹膜识别完美结合

vbox8154_WMZ_4229_165315_small_v1.JPG

所有生物识别的技术,可以说,要想提高安全性,首要解决的问题就是如何完成活体检测。据七鑫易维手机业务产品总监孔祥晖介绍,目前活体检测大概分为几类,手指、虹膜或者基于交互。一是动作指令活体检测,这一类活体检测大多被应用于银行等高安全性的行业应用中;二是静默活体检测,主要采集人的微表情,通过眼纹、眼皮、瞳孔等微表情信息来确认是否真人;三十红外活体检测,利用光谱特性不一样,在不同物体的反射上会有不同效果,通过分析图片来判断是否真人。

 

而现在,基于眼球追踪技术的方法来完成活体检测,是七鑫易维的新方案。那么它是如何做到的?人的视觉中是有人的视觉里是有中央视觉的,眼球追踪技术是在判断你的注视方向和注视点的位置。把人脸照亮拍摄图片,把图片放在后端机器学习、深度学习,识别出人脸的信息。通过算法,最终呈现出注视点的注视方向和位置,从而分辨出这是否真人,和他是否自主注视着传感器。

 

除了活体检测,眼球最终其实还能够用于VR/AR等应用。孔祥晖举了几个例子,一是用户管理,记录用户生态ID;二是做用户交互,设备的操作可以使用眼镜来完成,通过眨眼、注视等来完成各种操作;三是数据分析,比如在广告场景中,可以判断用户关注广告上的哪一个部分,从而获得他们关注点的信息,便于改进产品或广告。

 

 

AI边缘计算——下一个十年风口


得益于深度学习,近年来人工智能技术发展迅速,而生物识别技术也伴随着人工智能而迎来了爆发。但人工智能的发展也同时离不开算力的支持,相比于传统的CPU、GPU,AI专用芯片对于人工智能而言效率有着显著提高。嘉楠科技销售总裁蔡博表示,AI芯片是智能时代的核心,不管AI算法、AI智能所有的东西都是基于芯片的基础上,如果没有芯片,再好的算法只是一个模型,无法实际使用。

vbox8154_WMZ_4297_170906_small.JPG

嘉楠科技最开始做矿机,但其实在AI芯片方面他们也有一定的沉淀。去年9月,嘉楠科技正在发布了他们的第一款芯片K210,基于RISC-V指令集架构,集成8兆CMM,定位于人工智能与边缘计算领域,主要目标市场定位在IoT市场。通过完全自主研发的神经网络加速器IP,可在仅0.3W的低功耗下提供1TOPS的算力支持。同时具备机器视觉和语音识别能力,可以在超低功耗下进行高速卷积神经网络计算。如基于卷积神经网络的目标检测和图像分类任务,如人脸检测和人脸识别,多分类物体检测与识别等。。而在2019生物识别技术与应用高峰论坛上,蔡博还透露了年底将会发布第二款芯片,配合5G需求的K510。

 

蔡博还表示,第一代边缘计算芯片偏向小场景应用,比较小的IoT场景。第二代场景会偏向实时、高速和大场景中的应用需求,也是以边缘计算为主。随着5G到来,有很多大算力要求的场景和实时性的要求,第二代的K510芯片就是面对5G的这些场景需求。而嘉楠科技未来的目标就是希望在边缘AI计算领域成为领导者。



本文为华强电子网原创,版权所有,转载需注明出处

关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志

关注方法:添加好友→搜索“华强微电子”→关注

或微信“扫一扫”二维码

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子