“百模大战”成为行业热潮之后,作为算力、算法底层支撑的云计算,不可避免成为互联网大厂之间的角力重点。
陆玖商业评论从相关渠道获悉,继四月底“史上最大规模”的降价之后,阿里云的公有云产品未来仍有持续降价的可能性。
阿里云背后的考量既简单又复杂:公有云逐渐“一统”云计算江湖的因素有之,“百模大战”对于算力资源需求的暴涨,也成为阿里云促进“算力普惠”更加充分的理由。
现如今,当百亿和千亿成为了模型训练的基础单位,更低的算力价格,也为阿里云吸引了更广阔的B端用户,在更大的用户基数面前,固定资产的前期投入也因此被无限摊薄。
但在大模型和公有云的双重催化后,云计算行业的“局部战争”已经实质性结束,至于全面战争,才算刚刚开始。
公有云的必然性
阿里云之所以还有降价的底气,不仅依仗的是国内公有云市场份额的头部地位,公有云本身逐渐成为行业主流也是原因之一。
相比“吃大锅饭”的公有云,私有云的优势在表面看来确实很大,包括但不限于:更好的数据安全和服务质量,对于基础设置等程序参数拥有定制的权限等等,从实质上来说,这是企业传统数据中心在云厂商处的延伸,与外部租用服务器并无太大差别。
不过,即使坐拥“私密性”等优势,私有云的弊端也远比想象中更多更复杂,这也导致其在市场份额的竞争上逐渐让位于公有云,变成市面上的“非主流”。
其一是数据安全问题。
乍一看,这是一个不该发生在私有云身上的问题,非公有属性限定了用户接触服务器数据的形式,客观上,安全性也因为更少的访问量而得到提升。
但在实际的市场环境下则不然。陆玖商业评论了解到,在数据安全层面,私有云的安全性在某些情况下甚至逊于公有云。
网络安全上市公司奇安信相关人员告诉陆玖商业评论,目前云服务器的调用方式,从最开始的服务器端、PC端,一直延展到移动端,乃至大模型端的API调用。
随着接口数量的增加,其安全隐患和对应的安全需求也一同指数级上升。而公有云和私有云“安保力量”的区别 ,则更像公共交通和私家车之间的区别。
目前成规模的公有云厂商,如腾讯云、阿里云、华为云等等,任意一家的安全和运维人员都是数以百计。
哪怕是中大型企业部署的私有云,其安全人员的规模与投入的力度,都无法与公有云厂商相比。在数据安全系数上,也因此出现了参差。
其二则是云资源的利用率低下问题。
这也并非是私有云的特产,类似的情况公有云同样存在,只是私有云的算力浪费情况更为突出。
在4月25日的中国移动云大会上,清华大学计算机科学与技术系教授郑纬民直言不讳,表示如今云资源的行业利用并不充分:“我们现在云计算CPU的利用率不高,从整个国家来说,公有云能得到20%~30%,已经很不错。”
同时,云计算需求量很大的国营企业,在大多数情况下也不是公有云的用户,往往会自己建私有云,这部分市场由华为云、天翼云、移动云等运营商云所把持,但实际利用率更低,“只有5%到10%。”
降价更像是一个结果
阿里云此前的降价策略,抛开“算力普惠”的幌子,仍可一窥成为行业“基础设施”的野心;但后续的再度降价,则更多是为云资源利用率的上升服务,并最终带来利润的提升。
虽然在大多数时候,降价和利润通常站在对立面。但对云业务而言,降价往往会起到“以价换量”的效果——当云用户逐渐增加,分摊云成本的分母变多,成本降至足够低的时候,原本的亏损就会因为规模而转为盈利。
阿里云相关人员告诉陆玖商业评论,就公有云领域而言,降价更像是一个结果。
原因说来也并不复杂:随着整体公有云规模的扩充,效率提升同样也呈正相关。在规模扩大的同时,阿里云的技术红利也会随着不断释放,市场端的体现,其实就是降价。
从市场份额优先到利润优先,阿里云的侧重点自是发生改变,这与阿里云的发展阶段同样息息相关。
中国电信旗下的研究院,把云计算厂商划分成三个发展阶段。其中,第二阶段是能力锻造和价值提升阶段。
这个阶段的突出特点是,研发投入大幅提升,接近或高于资本性投入,云产品品类丰富,尤其是PaaS和SaaS品类繁盛,产品能力具有较高的竞争力,市场份额持续提升。阿里云和谷歌云,处在这一发展阶段。
同时,如果用云业务收入的增速和盈亏两个指标来衡量,处在第二阶段的云厂商,营收增速相比第一阶段通常放缓,但减亏进程已经开始,扭亏为盈。
但这里同样也有市场份额作为前提。作为典型的集约规模化市场,云厂商的体量没有达到一定的规模,盈利和价值仍然是一句空谈。一般而言,当市场份额达到10%以上,才能摊薄成本,实现盈利;只有市场份额达到15%以上,马太效应才得以发挥,竞争优势才能显现。
把目光限定于国内的话,阿里云已经达到发挥竞争优势的门槛。根据IDC最新发布的公有云市场报告,阿里云的市场份额从此前的36.7%降至31.9%,但仍然在国内保持第一。而在国外,虽然阿里云的排名仅在亚马逊、微软、谷歌三家之后,但只占据5.2%的全球份额,很难在更大范围内发挥规模优势。
这或许也是阿里云既要通过降价冲规模,又通过规模要利润的核心原因之一——在国内公有云市场,阿里云已经可以通过较高的用户量来摊薄成本,换来一定程度的利润增长;但在全球范围内,阿里云仍然需要通过价格优势来与亚马逊、谷歌、微软等对手竞争,保持一定程度上的“性价比”。
此外,阿里云相关人员向陆玖商业评论补充,与最初阶段相比,阿里云在十年时间里,算力成本下降的幅度大约在80%。存储成本下降大约在90%。所以云产品降价,背后仍然与成本下降强关联。
大模型需要公有云算力
如果说阿里云的持续降价,是通过价格手段解决了当前阶段的算力分散和盈利问题,那么对于方兴未艾的大模型赛道来说,体系化、规模化的公有云,同样为新一轮大模型创新和产业化提供了入场券。用更夸张的说法来讲,这是一个必要条件,而非充分条件。
类似的观点,阿里云智能科技研究中心主任安筱鹏已经提及。他在此前的一场研讨会上,复盘过OpenAI发生在美国的五个核心条件,主要是理论模型的先进、训练成本下降、云计算产业导致算力门槛降低等等。
安筱鹏分析称,这五个核心要素,表面来看是人工智能大模型的竞争,但从本质来看,仍然是AI大模型与公有云体系化能力的竞争。
道理同样也很简单,目前市面上可用的大模型,数量固然很多,但要真正到商业化那一步,整个过程中投入的算力成本和数据成本,都将成为制约其发展的核心。
除此之外,依据TRansfoRM的理论,一个理论模型想要变成千行百业的垂直大模型,都需要经过理论、工程化、产业化三个阶段。在理论和工程化阶段,可以在离线的条件下进行,一旦走到产业化和商业化阶段,通过公有云的手段来进行输出,将全国乃至全球的产业链资源进行合理配置,也是必要条件之一。
这里为何强调公有云?因为在私有云的条件下,同样的模型,训练成本在带宽等一系列软硬条件的束缚下,往往会耗费更高的成本。同时,在极低的私有云利用率下,用私有云训练模型,既不效率,也不经济。
行业分析师告诉陆玖商业评论,以今年大火的大模型赛道为例,OpenAI的ChatGPT即是依托微软公有云研发三年而成。但他们对于云资源的利用,高峰期仍然是在模型训练与研发阶段。
如果是其他的产品型公司,仅仅因为一个大模型,就购置大规模的算力资产,在短期研发后就弃之不用,同样是显而易见的算力浪费。当一个新技术与新产品,对于算力的需求越高,公有云相对私有云的机会,实际上也越大。
某种意义上,这也算得上“专业人做专业事”的范畴。
厮杀才刚刚开始
对于阿里云这类云厂商来说,无论是自身进行通义大模型家族的训练和落地,还是为其他大模型提供云服务,对于自身的公有云体系来说,同样也是巨大的机遇。
其中一种机遇是算力形式的转变。譬如阿里云在早期阶段,主力产品是传统的IaaS,在尚未规模化之前,平均一元营收要亏损5元。但到如今,以服务器和计算机为代表的传统算力,已经被云计算的智能算力所取代。
因为如今云厂商的内涵,远不止卖服务器和卖算力这么单纯,通过与大模型厂商的合作,不断推出与大模型配套的生态服务,已经开始不断从云上衍生出新的技术可能。
以大模型训练为例,大模型训练的高成本已经成为业内共识,一张英特尔特供版的H800显卡,仅售价就需要高达20万。但是一个足以大规模商用的模型,最终成本可能是成百上千个20万。
但在云计算的变革下,只需几万元,就能在阿里云按月购买AI训练的GPU集群,对于一些被天价显卡挡在门外的初创大模型团队来说,智能算力带来的训练成本降低,意义不言而喻。
除此之外,公有云与私有云的另外一层更大的区别,是在于云厂商的服务能力差别。阿里云相关人员向