人工智能 · 2024年1月27日

百度输入法的离线中英自由说功能领先于行业,识别流畅度和精准度达到最高水平

近日,AI实力强劲的百度输入法又向业内投下一颗“重磅炸弹”——业界首发“离线中英自由说”功能。这项基于中英文SMLTA模型的创新功能,让用户在弱网甚至无网络环境中,依然可以顺畅地进行中英文语音混输,且识别准确率和有网络时一样优秀, 准确率超过98%。百度输入法在此前推出的“在线中英自由说”功能基础上,借助AI技术赋能对语音输入进行了又一次重大升级,大幅提升了用户交互效率,全感官输入2.0再迎重磅升级。

百度输入法首创离线中英自由说,识别流畅度与精准度均行业领先

(百度输入法离线中英自由说功能)

据了解,百度输入法此次推出的“离线中英自由说”功能已经在V9.3.5版本中全新上线。除支持中英文夹杂的离线混合输入之外,还可精准识别离线状态下的英文整句、中文整句输入。例如用户不便打字正在用语音输入一段话,可一走进地铁,语音识别却跟不上。而百度输入法的离线中英自由说功能就能很好地解决这个问题,它支持用户在地铁、电梯、高铁或隧道这类弱网甚至断网的环境下,依然可以自如流畅地语音录入,且无需进行中英文手动切换。此外,“离线中英自由说”依旧支持流式识别,即语音输入可以跟随用户的话音逐字实时上屏,满足用户对语音识别实时性和流畅性的高需求,真正让用户实现了“随时随地随心说”。

一直以来,离线的语音输入就是行业一大难题,由于传统的离线中英文混合识别计算资源有限,需要限制模型的体积,因此极大限制了离线识别系统的性能。而百度输入法的离线中英文语音识别系统,针对性地采用中英文混合建模技术,提出基于低帧率、低比特的中英文SMLTA模型,其中采用神经网络语言模型替换传统的N元语言模型,大大减少了离线识别模型的体积。与此同时,基于SMLTA的离线中英文语音识别系统还是首个基于Attention的端到端离线语音识别模型的产品部署,大幅提升了离线中英文语音识别系统的性能。

在AI技术加持下,百度输入法的语音输入能力不断突破,在创新功能、用户使用频次、体验满意度等方面始终领跑行业。今年年初线上交流需求爆发,百度输入法便捷、高效、准确的语音输入功能便成为特殊时期人们的沟通首选,自1月25日春节假期以来,日均语音请求量破10亿次大关,并且“扛住”了高流量和用户高标准的双重“高压”,持续为用户提供不卡顿、不出错的语音输入服务。此后艾媒咨询发布的《2020中国第三方手机输入法市场疫期专题报告》也表明,百度输入法在行业内拿下用户日均语音输入次数、满意度等多个行业第一。百度输入法深谙用户对于多语种、多环境下语音输入的需求与痛点,不断降低着语音输入的使用门槛,自然也收获了用户和行业的广泛认可。

从“中文识别”到“中英自由说”,从“在线状态”到“离线环境”,百度输入法对AI技术的应用,不仅提升了手机输入法的智能化程度,也极大改善了人机交互效率。当语音输入日渐主流,用户习惯加速养成,对于手机输入法厂商而言既是机遇也是挑战,相信百度输入法还将加码AI技术的应用,驱动语音输入继续升级迭代,持续优化“全感官输入2.0时代”的AI输入体验。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.