AI语音延时是“头号杀手” 由表及里或可逐层“破解”
作为任何一款注重“强体验”AI语音产品的“头号杀手”,语音交互的延迟可以说在如今风靡于世的智能音箱乃至TWS智能语音耳机等各类AI语音终端应用中广泛存在。针对TWS耳机端的语音交互,目前业界在降低延迟上主要围绕两个层面进行优化,其一就是表层的端到端延迟。一般来说,立体音频传输过程中,不同的端端之间由于数据编解码方案、标准以及数据包结构等不同,在端到端传输上的延迟也会存在比较大的差异,有的可能高达几百毫秒,而有的可能才几十毫秒,二者能够提供的应用体验也由此相差甚远。
事实上,端到端传输延迟主要是还是基于音频技术上的问题,但当其加入到耳机端AI语音交互系统和流程中以后,会对整个系统的延时产生影响,褚文才告诉记者:“事实上,传统的TWS耳机端音频延时解决方案在传输层主要采用了支持标准SBC编解码器的A2DP协议以及基于心理声学感知技术的编码算法。但基于这种压缩技术的方案由于采用了帧压缩,其整体延迟时间比较高,其中包括了音频编码器对数据编码和数据发送的累积延迟、数据包接收延迟和数据包顺序编解码延迟,计算下来整个过程可能高达100ms至500ms。而且,由于比特率设置特点不同,基于这种方案提供的音频质量也存在高度易变的特性,即使采用的是多个同样的编解码器,也无法提供稳定的音频输出。”
“在这方面,我们采用了一种基于ADPCM(AdaptiveDifferential Pulse Code Modulation)原理的解决方案,现在已经能够将延迟降低到50ms以下,基本让用户感受不到延时的存在。”褚文才进一步补充到,“该方案是一种针对16Bit或者更高位数声音波形数据设计的一种有损压缩的算法,能够将声音流中每次采样的16Bit数据以4Bit进行存储,压缩比达到1:4,是获得低空间消耗、高质量声音的非常好的途径。采用这种方案之后,我们的音频传输数据包会变成‘指令词+数据包’的方式,进一步提高数据包的填充效率,而且解码工作是从一开始接收到指令词就已经开始,能够将声音质量得到最大程度的还原,并降低好几倍的延迟时间。”
除上述表层音频延迟以外,由于现阶段TWS耳机自身不具备独立的数据运算能力,仅仅只是扮演着音频声源的角色,智能语音服务均还要通过手机端APP或系统来调取语音,进而传输到云端去做响应和处理。其中,如果网络传输速度差或者中断的话,可以说基本的语音功能都实现不了,信号差的情况下同样也会导致响应和回传等延迟问题。
无论是在智能音箱还是TWS无线耳机等领域,通常在线的智能语音交互非常依赖云端侧的处理,深圳市木瓜电子科技有限公司某技术支持工程师解释到:“设备的前端往往只做声音的采集、回声消除以及噪声抑制等处理之后,通过网络送入云端去做语音识别和处理,处理后的结果又通过网络返回到设备中,这个过程容易产生两个问题,一旦网络出现问题,语音交互功能就可能瘫痪;另外,就算在网络好的情况下,设备的响应速度还是不尽理想,比如前端语音处理时间大约500ms、再通过网络端需要100ms。不止如此,云端处理约500ms,其中还会有延迟再返回,一共加起来可能需要1到2s的时间,尤其是像国内网络不稳定的情况下,时间可能更长。”
因此,现阶段在TWS耳机领域有不少厂商在尝试用本地语音唤醒方案来解决上述问题,以弥补部分因网络不佳或断线的情况下所造成的语音交互进程中断,这在一定程度上优化了TWS耳机智能语音交互中断和延迟问题。类似智能家居领域的本地化语音控制,本地化方案也能通过少许的唤醒词即可在离线情况下通过TWS耳机来实现的音乐的语音控制(切歌、暂停)、接听电话、查看信息等基础功能,可以满足用户的很多基本需求。
不过,在编者看来,本地语音唤醒对于TWS智能耳机来说只能算是一个过渡方案,随着5G高速网络的逐渐普及其市场发展空间可能会逐步缩小,褚文才对此表示赞同,他认为:“5G及万物互联真正大规模普及之前,可能本地化语音处理会在TWS智能耳机这类细分市场会有一定的发展空间,但由于此类方案更多的还是属于控制型而非交互型,并不具备‘真’智能的特性,指令词也十分有限,实际应用中最多只会被用来做一个辅助方案,难以形成市场主导,而且给用户带来的体验感实际也很一般;另一方面,由于耳机属于一种非常小巧的设备,受容量、功耗及数据处理能力等多方限制,要在耳机端做边缘计算的话,对芯片设计也会提出非常大的挑战,这不仅是技术方面的问题,更多的可能还会有成本以及刚需的考量在里面。”
本文为华强电子网原创,版权所有,转载需注明出处
关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志
关注方法:添加好友→搜索“华强微电子”→关注
或微信“扫一扫”二维码
本文为华强电子网原创,版权所有,转载需注明出处
关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志
关注方法:添加好友→搜索“华强微电子”→关注
或微信“扫一扫”二维码
- •最新元器件终端市场销售情况及产业机会分析 | 2025022025-03-04
- •2025年半导体最具发展潜力技术领域Top10进展报告2025-02-28
- •最新全球汽车Tier1电子零部件厂商业绩大PK2025-02-19
- •电子元器件销售行情分析与预判 | 2025年1月2025-02-13
- •全球汽车动力与底盘用MCU芯片架构大PK2025-02-08
- •电子元器件销售行情分析与预判 | 2024Q42025-01-16
- •电子元器件销售行情分析与预判 | 2024年12月2025-01-09
- •最新全球TOP15电子代工ODM头部厂商业绩大PK2024-12-31
- •电子元器件终端市场销售分析 | 2024年12月2024-12-31
- •2024年电子元器件行情分析与2025年趋势展望2024-12-25