互联网资讯 / 人工智能 · 2024年3月3日 0

中美竞争英伟达,AI芯片市场难以垄断

随着英伟达率先占领 AI 大模型算力芯片市场,并超过万亿市值。而同时,英特尔、AMD和中国GPU芯片公司也在暗暗较劲,希望在AI算力芯片市场中分一杯羹。

9月19日,美国圣何塞举行的Intel On技术创新大会上,62岁英特尔 CEO 基辛格(Pat GelsingeR)“火力全开”,以俯卧撑开场演讲。

此次会议上,基辛格一口气发布一系列新技术产品:基于Intel 4(5nM)工艺的英特尔酷睿UltRa处理器,代号“MeteoR Lake”;预览第五代至强服务器芯片和后续至强产品路线图;披露5nM AI 芯片Gaudi 3等。

相比往届,此次基辛格“变身皮衣老黄”,全场近2小时大谈 AI 算力对经济的作用。据钛媒体app统计,此次演讲中,基辛格约有200次提到“人工智能”、“深度学习”相关术语。

几乎在同一时间,英特尔、英伟达的竞争对手AMD公司,发布了最新EPYC 8004 CPU(中央处理器)芯片,并预计年底前出货MI300系列AI芯片,以对抗英伟达。此外在国内,包括华为、天数智芯等 AI 芯片厂商也在积极布局大模型训练推理和 AI 算力产品。

“我们与 AI 算力芯片市场领导者英伟达竞争非常激烈。但无论是Gaudi2 还是Gaudi3,都比他们往前迈出了一大步。我们正在获得动力,市场开始意识到,AI 芯片行业领导者中还有另一个机会。”基辛格9月20日对CNBC表示。

市场竞争加剧

“老黄”难以独食万亿AI算力

2023年至今,以ChatGPT为代表 AI 大模型“热潮”席卷全球,大模型正推动 AI 向更通用方向发展。

同时,算力的稀缺和昂贵已成为制约 AI 发展的核心因素。而算力也成为了全社会数字化、智能化转型的重要基石,从而带动智能算力需求激增。

据AMD首席执行官苏姿丰(Lisa Su)提供的数据显示,2023年,全球数据中心AI加速器的潜在市场总额将达到300亿美元左右,预计到2027年,这一数字将超过1500亿美元(约合人民币1.095万亿元),年复合增长率超过50%。

英伟达企业运算副总裁曼努维尔·达斯(ManuviR Das)给出了另一组数据显示,预计 AI 所在的潜在市场(TAM)规模将增长至6000亿美元。其中,芯片和系统可分得3000亿美元,生成式AI软件可分得1500亿美元,另外1500亿美元则由英伟达企业软件贡献。

很明显,AI 算力芯片市场是一块大“蛋糕”。

但目前,英伟达却占据全球数据中心 AI 加速市场82%的份额,而且以95%的市场占有率垄断了全球 Al 训练领域的市场,成为这轮 AI 混战中最大赢家。而黄仁勋和他的英伟达公司赚的盆满钵满,市值超越1万亿美元。

与此同时,算力需求的激增,直接导致英伟达GPU(图形处理器)“一卡难求”。而有多少英伟达A100显卡,已经成为衡量一个公司算力的标准。

事实上,一家企业若想研发通用大模型,在算力层面需首先关注两点:显卡数量和价格。

其中,显卡数量方面,OpenAI使用了1万-3万颗英伟达GPU来训练GPT-3.5模型。据集邦咨询最新报告显示,如果以英伟达 A100 显卡的处理能力计算,运行ChatGPT将可能需要使用到3万块英伟达GPU显卡。另外在开源模型方面,LlaMa模型则是在2048块80GB A100上训练,整个训练算力接近2000 PTOPS算力。

价格方面,目前国内可以买到的H800价格已经高达20万/张,而A100/A800价格已涨至15万、10万/张左右。以2000P算力需求为例,H800 GPU单卡算力2P,需要1000张,预测整个卡价格为2亿元;A800单卡算力约为0.625P,需要数量为3200张,预计整个显卡价格就高达3.2亿元。

除了买GPU显卡,服务器还要考虑整机配置运算,包括CPU、存储、NV-link通讯连接等,以及电力消耗、场地租金和运维成本等因素。

当下,A800和H800服务器主要以8卡机型为主,为了满足2000 P的算力,就需要配置125台8卡H800服务器,或400台8卡A800服务器,价格分别为3亿元、5.6亿元。而且,由于H800还支持PCIe 5.0、新一代的CPU和内存等,因此需要提升价格,才能发挥其最优的算力性能。

所以,从大模型训练角度看,购买H800的总成本要低于A800,性价比更高,而且也比搭建CPU的成本要低——这也就是英伟达CEO黄仁勋最近常说的:“买的越多,省的越多”。

当然,如果你实在买不起也没关系。英伟达还贴心地推出在线租赁服务DGX超级AI计算系统,通过租赁的方式开放给企业,搭配8个H100或者是A100的GPU,每个节点640GB内存,每月租金为37000美元,从而不用自建数据中心购买大量GPU显卡。这类租赁方式毛利率很高,根据一份关于微软“云端算力租赁”服务报告显示,该业务毛利率高达42%,已成为微软新的“现金奶牛”。

那么国内市场,英博数科、商汤AIDC和其他超过11个智算中心/云厂商也有类似的服务,对于大模型来说,整体价格要比自建价格减少20%以上。

此外还有大模型训练时间。英伟达最新发布的NVIDIA L40S GPU,比A800/H800模型训练效率更高。一个70亿参数的模型,HGX A800跑完需要17个小时,而L40S速度要快1.3倍,短短半天时间就跑完了,更不用说一个1750亿参数的模型,用L40S一个周末时间就能训练完。

中美竞争英伟达,AI芯片市场难以垄断