借“AI+”之力:车载语音冲破“桎梏”迎来新机遇

来源:华强电子网 作者:席安帝 时间:2018-04-18 09:41

车载语音 算法 AI

  经过多年的渐进式发展,语音交互的价值正逐步走出单纯“控制方式”的狭隘理解,向业内人眼中的“大连接”阶段过渡。作为被连接的核心硬件之一,车载语音交互平台的争夺战近年来也正式进入白热化,各方势力频频出招,全球市场风起云涌。前有亚马逊、Nuance、Google等国际巨头,后有科大讯飞、百度、思必驰及云知声等国内厂商,通过携手全球各大巨头车企,共同推动车载语音交互从“命令式”、“自然式”向“主动对话式”时代全面进击。

  多方应用瓶颈尚存 软硬兼施是核心

  不过,受制于当前车联环境复杂、硬件配置参差不齐以及行车网络不稳定等因素,目前整个市场对语音系统的内存CPU消耗和网络处理能力的要求极高。而且,汽车是个难度很高的环境,其中的噪音、回声的干扰非常大,对识别技术来说是一种极大的挑战。

  事实上,有不少用户反映,目前车载语音识别从准确率来看还是差强人意,尤其是噪声情况下,因为车内噪声和一般环境周围噪声还是有很大区别的,需要录制行车过程中交互的音频并标注,这就需要耗费很大的人力物力;另外,车内有些语音功能还需要用唤醒技术,其中的唤醒虚警率与误判率也比较难控制,尤其是在充满人声的噪声情况下,从而导致用户体验大打折扣。

  对此,有业内人士表示:“针对诸如车载这类的嘈杂应用场景,目前芯片处理速率、识别率、预置方案匹配度〈算法〉、麦克风阵列、伺服器、电源、结构件、扬声器等反馈组件,各家的组合优化程度参差不齐。而就语音交互本身而言,当前最大的问题是如何通过软硬件的设计提升系统的抗噪能力。比如算法方面,干净环境(SNR较大)下,每种音素的数据分布比较稳定,即使有噪声其导致的误差也并不大,现有的算法模型就足够进行完美分类。但是,在嘈杂环境下(SNR较小),噪声种类千变万化,导致每种音素的分布在各个方向偏移较大,因此数据分布变得十分复杂,这就需要设计更为复杂的分类器算法,比如目前用的比较多DNN算法。不过,随着分类器的复杂化,算法开发成本也会随之进一步提升,甚至最后还不一定能很好的实现对噪声和有用信息的区分。”

武汉声云智能信息技术有限公司研发总监陈盛林

  而在硬件方面,目前主流的方案是采用多麦克风阵列技术来采集多个信号源的信号并综合分析出噪声和语音,从而实现信号分离以及语音增强的效果。武汉声云智能信息技术有限公司研发总监陈盛林解释到:“面对行车过程中的车外胎噪、风噪,车内空调声、引擎声等行车环境噪音,多麦克风阵列的设计宗旨是精准拾取说话人的语音信号、抑制噪声和混响、对残余的车载噪音进行进一步处理,从而准确识别司机语音。由于麦克风阵列需要根据声音到达的时间差来计算出声源与阵列模块之间的角度和距离,从而实现对目标声源的定位与跟踪,并利用麦克风阵列的空域滤波特性,在目标说话人的方向形成拾音波束,仅拾取波束的信号,抑制波束之外的噪声和混响(反射声)。因此在硬件设计上,麦克风阵列的定向设计、角度以及阵列中麦克风的数量配置就显得至关重要,比如麦克风的数量越多定位的方位就能够做的越窄,因此所受到的干扰也就会越小,而定向设计的好处是能够让硬件系统准确的识别到某个特定方向传来的声音,而当其他方向出现的语音命令输入源干扰并不会对该方向造成影响。”

  具体来讲,陈盛林补充到:“由于车子所处的环境噪音会随着车速、路段、路况、空调、乘客及音响等各种因素不断改变,而背景降噪演算法不易解决时时变动且突发性的声音,所以我们在车用语音智能产品在硬件设计上会着重在一些细节方面进行升级,例如采用两颗以上的麦克风阵列,以进行较佳的背景降噪演算法;或采用讯噪比较高的麦克风,最好是SNR 58dB以上。其次,把麦克风置于离驾驶嘴巴最近的位置,如方向盘附近;但同时又要尽量缩短麦克风线材至主机的距离,且加强线材隔绝性,以减少外来的杂讯。最后,则是加上回音消除、背景降噪以及麦克风自动增益等三种功能,来帮助提升语音辨识率。”

  此外,在商业化的进程中,现有的技术想要成功下沉到产品上也并不容易。陈盛林强调:“实际上,现在的很多功能不能被实装,并非是技术不到家,而是受限于成本、产品定位、研发周期等等一系列因素。就说麦克风阵列,麦克风的数量是越多越好,在车上装成一个球形,360°检测的识别效果是最好的,但是在实际的应用中要考虑成本问题,这些问题是需要方案设计者深入使用场景,提出合理的解决方案的;另一方面,就是目前车机的平台并不是一个开放的平台,既不是安卓的开源,也不是苹果的封闭生态,很难在既定构架上简单地进行功能的增减删改,很多时候,一个更新换代,可能要做的工作是从头再来;再者就是方案商与车企之间需要很多配合,如果车企已经有一套完成的车载系统,那么需要对语音识别的应用打开接口,打开接口之后可能会发现接口无法直接对接,需要进行更改,而这个更改是否能被执行,要看汽车制造商的集成能力,以及对这套车载系统有多少期待,即便车企没有这套系统,或者要开发一套新的系统,双方在产品理念需求的定义上,也需要深度磨合。”


分享到:

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子