高品质语音反馈“道阻且长” 一场软硬件端的“持久战”
如果说语音延时是TWS智能耳机产品体验的“头号杀手”,那么语音反馈质量可能就是产品体验最直接的“形象代言”。众所周知,无论当今任何一款AI语音交互设备,用户最终接收到的语音数据反馈效果都极大程度地依赖于设备及云端语音平台对用户所发出的语音数据接收、识别以及处理的精准度。实际应用场景中,难免会遇到各种环境音、环境波以及语言、语音甚至语意千变万化所致的干扰,纵使是当今全球最接近人类语音能力的Google Assistant也并不能达到用户的期许,因此提升TWS智能耳机端的语音反馈质量终将是一场“持久战”。
褚文才对此表示赞同,他强调:“目前的语音交互系统,还仅停留在能够适应它们所得到的训练数据集的水平,而一旦当你把它介绍给它从未听过的东西时,其语音识别的质量就会大幅下降。例如,如果你的训练数据集是会话语音,那么在繁杂的现实环境中你的识别语音效果和最终反馈效果就不会太好,甚至可能很差,而且在有回声、噪音甚至重音等情况下,算法也很容易出错。”
那么,通过积累更多的各类数据集,是否就能够有效解决该问题呢?褚文才并不这么认为:“其实,积累数据也有其不利的一面,虽然一般情况下,表现最好的神经网络还是那些拥有最多数据集的网络。但由于这些数据通常需要在CPU上进行处理,CPU的压力也会随着信息量的增多而增加。今天,可能我们能够在市场上看到不少性能强大的AI芯片,但事实上这些芯片还远未达到能够与移动设备完美集成的程度,很多潜藏的AI能力尚未得到有效挖掘,这就使得实时语音处理这类功能在今天依然无法成为现实。实际上,每次使用Google Assistant时,语音信息都还是会被发送到数据中心进行外部处理,然后再发送回用户的手机上。这些计算工作都不是在本地完成的,因为现有的手机都无法存储神经网络处理语音所需的庞大数据,更别说TWS无线耳机这类更小型的设备上了。”
所以,要想做好TWS无线耳机终端侧的语音交互和反馈体验,软件算法和硬件芯片端的共同发力十分必要。褚文才补充到:“国内其实已经有不少比较好的语音算法技术提供商,产品也做的非常不错,但实际应用场景是变幻莫测的,从技术落地的角度来看其实还需要做很多针对场景端的算法优化,就如TWS无线耳机领域除了普遍存在的降噪、滤波等各种需求外,还会存在不同场景的客制化需求,比如运动场景。”而硬件侧,编者认为在现有AI芯片的基础上做更多针对性的语音处理技术集成以及算法适配尤为关键,让芯片即使处在极端复杂的音频环境下,仍然能通过特定且对应的软件算法辅助做好语音交互过程中的各种数据处理,当然这一切还是要以低成本为前提。
总之,智能耳机内置语音助手已成当下全球TWS耳机市场的潮流。不过,从当前的市场需求来看,编者认为业界厂商还需要做到“有的放矢”,因为据相关调查显示,现在国内外几乎大部分人仍然是不习惯对着耳机自言自语的,即使是苹果通过取消手机耳机插孔的强制性方式逐步引导消费者购买Airpods,也是经过了一段相当长时间的市场磨合期。所以,目前厂商还是不要过分抬高消费者对TWS耳机智能化的市场预期的好,可以采取先入为主,即主动为消费者打造刚需的方式,不断磨合软硬件技术,一定程度上解决耳机端AI语音交互痛点之后放开市场,才是让TWS智能耳机市场走上“健康”可持续发展的正道。
本文为华强电子网原创,版权所有,转载需注明出处
关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志
关注方法:添加好友→搜索“华强微电子”→关注
或微信“扫一扫”二维码
本文为华强电子网原创,版权所有,转载需注明出处
关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志
关注方法:添加好友→搜索“华强微电子”→关注
或微信“扫一扫”二维码
- •中国工程院院士郑纬民:未来国产软硬件将逐步替代国外产品2023-01-12
- •全球首款双4000万像素摄像头背后的“高品质+高造价”2019-09-30
- •AI语音延时是“头号杀手” 由表及里或可逐层“破解”2019-04-10
- •依图科技发布语音开放平台 联袂微软、华为撬动语音市场2019-01-23
- •光控式语音报警电路2019-01-23
- •韵律操音乐旋律的语音电路2019-01-23
- •语音电子词典电路2019-01-23
- •光控语音防盗报警器电路图2019-01-23
- •高保真语音录放电路2019-01-22
- •永久记忆型语音的循环放音电路图2019-01-22