互联网资讯 · 2024年5月21日 0

阿里降价97%,百度免费,大型价格战比“618”更激烈

5月20日,电商年中大促“618”正式开启,各家电商平台还在忙着统计首日战报,大模型价格战已经率先打响,甚至比618还要猛烈。

阿里降价97%,百度免费,大型价格战比“618”更激烈

21日上午,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long,API(应用程序编程接口)输入价格从0.02元/千Tokens降至0.0005元/千Tokens,直降97%,相当于GPT-4价格的约1/400。

上周,字节跳动发布豆包大模型,并宣布豆包通用模型Pro-32k版的推理输入价格为0.0008元/千Tokens,首次将大模型价格带入“厘时代”。如今,通义千问的价格比豆包大模型还要便宜。

按照上述价格计算,1元能买到豆包主力模型的125万Tokens,相当于3本《三国演义》,而1元也可以买到通义千问主力模型的200万Tokens,相当于5本《新华字典》。

阿里降价97%,百度免费,大型价格战比“618”更激烈

那么,问题来了,字节、阿里、百度三家大厂已相继宣布大模型降价,腾讯会不会跟进?

日前,腾讯云副总裁、腾讯云智能负责人吴运声在接受采访时,没有明确回答是否会加入大模型价格战,他表示,“腾讯更关注大模型能力的提升,致力于为行业提供能力和价格兼具的产品。”

从卷技术到卷价格

前两年,大模型公司还沉浸在拼参数量、拼文本长度。今年以来,整个行业从卷技术到卷价格,大模型降价已成趋势。

在字节等大厂纷纷宣布降价之前,已经有不少厂商下调大模型使用价格。

5月6日,AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2,该模型API定价为:每百万Tokens输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一。

5月11日,智谱大模型官宣新的价格体系,入门级产品GLM-3 TuRbo模型调用价格从5元/百万Tokens降至1元/百万Tokens,降幅高达80%。

这样的趋势,同样在国外发生。今年2月底,法国AI公司MistRal AI发布最新大模型MistRal LaRge,该模型输入、输出价格比GPT-4 TuRbo便宜约20%。

而自去年以来,OpenAI已经进行了4次降价,其最新发布的多模态大模型GPT-4o,不仅性能有了很大提升,价格也下调了50%。

降价背后是大模型结构、训练等成本的持续优化。李彦宏曾在CReate 2024百度AI开发者大会上透露,与一年前相比,文心大模型推理性能实现了105倍增长,而推理成本却降到了原来的1%。

今日,创新工场董事长兼CEO李开复在接受媒体采访时表示,在一定程度上,整个行业每年降低10倍推理成本,这是可以期待的,而且是必然也应该发生的。

此外,火山引擎总裁谭待也曾表示,市场对降价的呼声比较高,平台必须把试错成本做到非常低,才能让大家用起来。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。

为什么要打价格战?

现在,大模型还是一个高投入、低产出的行业,为什么厂商还要打价格战?答案也很简单:加速商业化落地。

大模型卷到2024年,一个新的赛季已经打响,应用场景的落地成为竞争主旋律。大模型定价的持续走低有望带来更快的商业化落地。

上周,OpenAI、谷歌、字节跳动、腾讯四家大厂相继披露在大模型领域的最新进展,无一不聚焦在应用侧。

硬核如OpenAI,对于最新发布的多模态大模型GPT-4o,也没有以往对参数指标的生硬强调,而是选择集中展示多场景下的用户体验。这被认为是OpenAI加速应用落地的表现。

在腾讯云生成式AI产业应用峰会上,吴运声在谈及大模型商业化的问题时表示,技术的突破未来一定会带来商业化的机会,而且会呈现跨越式的增长态势。AI要真正落地实用,推理成本的降低、工程性能的极致优化至关重要,是未来商业化取得突破的重要因素。

当天,腾讯集团副总裁蒋杰在大会上宣布,腾讯混元大模型通过持续迭代,目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。

值得一提的是,目前大模型的应用还在早期阶段,仍有很大的发展空间。QuestMoBIle数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。

海通证券5月17日研报指出,伴随国产AI大模型的持续升级,2024年有望成国产AI大模型全面商业落地的元年,先进的AI大模型能力也将逐渐转化为落地实际场景的产品应用,从而带动AI大模型在金融、教育、法律、医疗等众多垂直行业的持续落地,AI2B与AI2C的需求天花板也有望全面打开,在这个过程中,AI的投资也从映射和跟随,变为引领。