互联网资讯 / 人工智能 · 2024年1月19日

ChatGPT语音转文字服务现已上线:中文识别仍有待提高,费用每分钟4分钱

ChatGPT在积累了1亿用户之后开始尝试商业运营了,昨天正式发布了API,企业可以付费接入,75万单词只要2美元,成本比之前降低了90%。

实际上昨天开放的业务还有一个,那就是语音转文字的API,基于公司的WhISPeR大模型,去年9月份首次推出WhISPeR LaRge-v1模型,12月开源了升级版的WhISPeR LaRge-v2模型。

这次商业化之后,WhISPeR API的收费也很低廉,每分钟只要0.006美元,人民币约为4分钱,预计会让很多语音相关的企业压力很大。

WhISPeR API支持对语音文件进行转录和翻译,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言。

ChatGPT语音转文字来了:每分钟收费4分钱 中文还不太行

不过不同语言的准确率差别不小,WhISPeR laRge-v2模型在识别西语、英语、意大利语、德语等语言单词错误率都能控制在5%以内,这种语言转文字之后只需要用户简单修改就好。

至于中文,v1模型的错误率就有19.6%,v2略微提升到14.7%,改进不大,错误率比英文、西语之类的高很多,用户使用起来有些麻烦,需要校正的地方就多。

至于为何有这样的差距,除了中文自身的特点之外,很可能跟训练使用的中文语料较少有关,毕竟网上的内容主要还是外文。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册