人工智能 · 2024年4月2日 0

国内大型模型,摒弃“烧钱游戏”

最近,OpenAI的Sora又在科技圈投入一枚深水炸弹。全球对于大模型的关注,又一次达到高峰。

聚焦到国内,百度、科大讯飞、商汤、华为等大型企业,以及海量的创业小公司都在布局大模型。以往每一次风口吹来的时候,资本总会蜂拥而上。但是,此次大模型热潮涌来之时,资本的反应很奇怪——讨论度很高但参与度却不高,赛道的投融资并没有想象中火爆。

研究机构CB insights发布的《2023年人工智能(AI)行业现状报告》(简称“报告”)显示,2023年中国AI领域投融资数量约为232笔,同比下降38%;融资总额约为20亿美元,同比下降70%。其中,AI大模型的融资活动也没有呈现上升态势。

今年以来,不少投资人对大模型变得更加审慎,“谈得多、投得少”成为常态。某投资人告诉《一点财经》,现在国内资本圈对于大模型持观望态度的机构变得更多了,因为大家担心大模型在去年经历了一轮爆火之后,变得估值虚高形成了泡沫。

连街头大妈都知道,AI大模型是当下最热门的科技话题,为何在国内大模型似乎受到资本“冷落”?国产大模型,为何没有引爆一场“烧钱游戏”?

国产大模型,“冷热”分明

上一个像AI大模型一样热闹的风口,还是十年前的移动互联网。十年之后,移动互联网声势渐弱,换AI大模型来接棒。

ChatGPT的横空出世,拉开AI大模型的全球竞速,热钱迅速涌来,也催生出巨大的市场空间。中研普华产业研究院数据显示,2024年全球大模型市场规模将达到280亿美元,并在2028年形成千亿美金的巨大蛋糕。

中国市场的大模型也呈井喷态势,在去年的前11个月,国内发布了238个大模型,平均每天都有一个大模型问世,从而掀起一场“百模大战”。

在这场“百模大战”里,互联网大厂是绝对的主力军。市面上的主流大模型厂商中,互联网玩家几乎占据半壁江山,比如百度的文心大模型、科大讯飞的星火大模型、阿里的通义大模型、腾讯的混元大模型等,华为、京东等科技公司也发布了自家的大模型。

不过,国产大模型的投资力度,并没有跟发布数量一样,呈大幅上升的趋势。IT桔子数据显示,2021年~2023年,中国AI领域一级市场的股权融资的数量和金融都呈下降趋势,大模型的投资也没有呈大幅上升的迹象。

一方面是投资并没有想象中的火热,另一方面是投资变得高度集中,都流向了头部的一些大模型项目。

去年下半年开始,投资方基本就筛选出了大模型创业公司里的种子选手。据《晚点 LatePost》发布的消息,最近大模型创业公司月之暗面完成了8 亿美元的B轮融资。同时,另一家大模型头部公司也在进行高达10亿美元的新融资。两笔10亿美元融资,加起来超过去年中国大模型领域的公开融资总额(约100亿元人民币)。

整个大模型赛道上的马太效应已经较为明显,市面上钱就这么多,头部玩家拿得多,其他中小型玩家拿到的融资就相当少了。

值得注意的是,大模型创业公司背后的投资名单里,密集出现了阿里、腾讯、百度、美团等互联网大厂的身影。不过,互联网大厂的投资风格,跟移动互联网时代有很大不同。

拿此前共享出行里滴滴和快的的烧钱游戏来说,背后分别是腾讯和阿里的博弈。双方多的时候一天投入4000万元,但互相都不敢收手,否则就前功尽弃。最后在资本的撮合下,双方握手言和,滴滴和快的合并。

移动互联网时代的烧钱游戏,更多的是对垒,竞争的火药味很强,而且烧钱的规模更为宏大。

而在眼下的大模型时代,互联网大厂少了些博弈、多了些和气,并且从一开始就站在同一队伍里。比如,阿里、腾讯、美团和小米都投资了大模型创业公司智谱AI 和百川智能。互联网大厂们似乎并不愿开启声势浩大的“烧钱游戏”,而是一致投向了头部选手。

这意味着,除了头部选手之外,其他中腰部的大模型创业者融资的难度在加大。要知道,在2023年初一些大模型创业公司只需要展示PPT就能获得融资,现在则需要花费更多的功夫了。

总之,从移动互联网到大模型时代,大家都在期待又一场滋滋作响的烧钱游戏,但实际上并没有发生。

那么,背后的核心原因又是什么?

成本与收益的数学题

不管哪个时代的“烧钱游戏”,对于背后的资本来说,锚定的两个本质是不变的:

成本和收益。

如果某项生意的成本可控且在承受范围内,同时收益肉眼可见且足够具有诱惑力,那么就会吸引大量资本涌入。

为何移动互联网时代,开启了多次烧钱游戏?正是因为许多生意的成本和收益都让资本足够放心。拿互联网史上最疯狂的“千团大战”来说,由于美国团购网站GRoupon的成功,资本认为该模式的成本可控,且在国内复制成功的机会极大,收益极高,因此疯狂涌入。

面对如今的“百模大战”,从成本和收益两个方面来看,资本的态度是极为审慎的,这也是国内大模型赛道没有开启“烧钱游戏”的关键原因。

成本上,大模型显然是一个猛烈的“吞金兽”,需要非常庞大的资金。最近,OpenAI被曝出单月收入超20亿美元,但仍处在亏损状态,可见成本之巨大。这是因为大模型要发挥出能力,需要两个“大”:

数据大和算力大。

要想让大模型有更全面的认知和更准确的预测,庞大数据是必备的基础,它可以提供丰富的信息不断训练和优化模型。在训练阶段,大算力可以加快模型优化的速度,从而使得模型更快地学习,实现更高性能。

当然,要想马儿跑得快就要给马吃草。要实现更庞大数据和强大算力,就需要投入巨大成本。千亿级的通用大模型训练成本,往往达到千万甚至亿元,普通的创业公司往往难以承受。

并且,即便大模型创业公司也在数据和算力上开始投入,又会带来两个新的不确定性。

一个是一旦开始投入,成本变得难以估量。即便是OpenAI这样不缺钱的头部玩家,也不确定未来还需要多少成本,更何况那些中小型的创业公司。这就极可能让竞争进入持续的军备竞赛,烧钱就会变得不可控。这就好比当年滴滴和快的竞争,最后烧钱变得疯狂且不理性。

比起成本高昂,资本更担忧的是成本不可控。

另一个不确定性是如果大模型创业公司持续布局数据和算力,也需要在硬件设备上进行高投入,整个公司会变得非常“重”。这在短期内不仅会影响收入也会影响估值,进而让投资人的回报增加更多的不确定性,这也是投资人所担忧的。

如果成本过大且不确定性因素较高,但收益是可观而且清晰可见的,那资本也会考虑加大投入。不过,大模型还处于商业化早期阶段,很多盈利模式并不清晰。

目前来看,大模型的商业化无非就是在C端和B端两头进行。C端商业化一般是通过大模型为用户提供新产品和工具实现盈利。不过,要激发C端用户的换新需求,除非有颠覆性的技术或者产品带来创新体验,否则很难吸引他们,更别提让他们付费。

短期内,大模型的C端付费用户很难有较大规模的增长。那些布局C端的大模型企业,更多的是在积攒市场关注度,赚个吆喝。

要赚钱,还得是靠ToB。

这是因为,B端企业的需求和付费意愿都比C端要强。很多B端企业本身就有处理复杂任务的需求,同时也有资金和数据,天然跟大模型适配。

不过,B端商业化虽然是条正确的道路,但也没有那么容易走。从过往产业互联网的进程来看,B端商业化从来都是块难啃的硬骨头。前期需要大量的投入,并且产出的速度较为缓慢。并且,很多B端企业的要求愈发严苛,必须看到实际的效果才愿意付费。

因此,对于资本来说,大模型的成本和收益都具有较大的不确定性,很多投资机构持观望和审慎态度,并没有催生出大规模的“烧钱游戏”。

投入与产出的平衡术

没有出现“烧钱游戏”,并不意味着国产大模型就不需要大规模投入了。

事实上,眼下国产大模型里的头部项目,每一个都离不开真金白银的投入。只是这种投入,不是“烧钱游戏”那种粗暴的、追求短期回报的,而是细水长流、追求长期主义的。

根据《人工智能大模型体验报告3.0》等报告,主流大模型中综合实力排在第一梯队的是科大讯飞的星火、百度的文心一言和商汤科技的商量。

这三家企业还有一个共同的特征,那就是舍得在研发上投入。移动互联网时代,百度一度被当做掉队者。但其2011年~2020年十年研发总费用增长超过13倍,为其在大模型时代的领先打下了基础;科大讯飞2023年前三季度研发投入达到24.98亿元,同比增长7.19%;2018年至2021年上半年,商汤的研发投入甚至超过了营收。

这三家做大模型的思路,也有相似的地方,都是打造基础设施,最终吸引各方参与做生态。科大讯飞偏向智能硬件和独立软件,百度偏向支撑原生应用的开发和产业的AI赋能,商汤偏向以“大模型+”拓宽边界,让金融、汽车等行业的企业能随取随用AI能力。

三家企业旗下大模型在国内的领先,也向