中美竞争英伟达，AI芯片市场难以垄断

随着英伟达率先占领 AI 大模型算力芯片市场，并超过万亿市值。而同时，英特尔、AMD和中国GPU芯片公司也在暗暗较劲，希望在AI算力芯片市场中分一杯羹。

9月19日，美国圣何塞举行的Intel On技术创新大会上，62岁英特尔 CEO 基辛格（Pat GelsingeR）“火力全开”，以俯卧撑开场演讲。

此次会议上，基辛格一口气发布一系列新技术产品：基于Intel 4（5nM）工艺的英特尔酷睿UltRa处理器，代号“MeteoR Lake”；预览第五代至强服务器芯片和后续至强产品路线图；披露5nM AI 芯片Gaudi 3等。

相比往届，此次基辛格“变身皮衣老黄”，全场近2小时大谈 AI 算力对经济的作用。据钛媒体app统计，此次演讲中，基辛格约有200次提到“人工智能”、“深度学习”相关术语。

几乎在同一时间，英特尔、英伟达的竞争对手AMD公司，发布了最新EPYC 8004 CPU（中央处理器）芯片，并预计年底前出货MI300系列AI芯片，以对抗英伟达。此外在国内，包括华为、天数智芯等 AI 芯片厂商也在积极布局大模型训练推理和 AI 算力产品。

“我们与 AI 算力芯片市场领导者英伟达竞争非常激烈。但无论是Gaudi2 还是Gaudi3，都比他们往前迈出了一大步。我们正在获得动力，市场开始意识到，AI 芯片行业领导者中还有另一个机会。”基辛格9月20日对CNBC表示。

市场竞争加剧

“老黄”难以独食万亿AI算力

2023年至今，以ChatGPT为代表 AI 大模型“热潮”席卷全球，大模型正推动 AI 向更通用方向发展。

同时，算力的稀缺和昂贵已成为制约 AI 发展的核心因素。而算力也成为了全社会数字化、智能化转型的重要基石，从而带动智能算力需求激增。

据AMD首席执行官苏姿丰（Lisa Su）提供的数据显示，2023年，全球数据中心AI加速器的潜在市场总额将达到300亿美元左右，预计到2027年，这一数字将超过1500亿美元（约合人民币1.095万亿元），年复合增长率超过50%。

英伟达企业运算副总裁曼努维尔·达斯（ManuviR Das）给出了另一组数据显示，预计 AI 所在的潜在市场（TAM）规模将增长至6000亿美元。其中，芯片和系统可分得3000亿美元，生成式AI软件可分得1500亿美元，另外1500亿美元则由英伟达企业软件贡献。

很明显，AI 算力芯片市场是一块大“蛋糕”。

但目前，英伟达却占据全球数据中心 AI 加速市场82%的份额，而且以95%的市场占有率垄断了全球 Al 训练领域的市场，成为这轮 AI 混战中最大赢家。而黄仁勋和他的英伟达公司赚的盆满钵满，市值超越1万亿美元。

与此同时，算力需求的激增，直接导致英伟达GPU（图形处理器）“一卡难求”。而有多少英伟达A100显卡，已经成为衡量一个公司算力的标准。

事实上，一家企业若想研发通用大模型，在算力层面需首先关注两点：显卡数量和价格。

其中，显卡数量方面，OpenAI使用了1万-3万颗英伟达GPU来训练GPT-3.5模型。据集邦咨询最新报告显示，如果以英伟达 A100 显卡的处理能力计算，运行ChatGPT将可能需要使用到3万块英伟达GPU显卡。另外在开源模型方面，LlaMa模型则是在2048块80GB A100上训练，整个训练算力接近2000 PTOPS算力。

价格方面，目前国内可以买到的H800价格已经高达20万/张，而A100/A800价格已涨至15万、10万/张左右。以2000P算力需求为例，H800 GPU单卡算力2P，需要1000张，预测整个卡价格为2亿元；A800单卡算力约为0.625P，需要数量为3200张，预计整个显卡价格就高达3.2亿元。

除了买GPU显卡，服务器还要考虑整机配置运算，包括CPU、存储、NV-link通讯连接等，以及电力消耗、场地租金和运维成本等因素。

当下，A800和H800服务器主要以8卡机型为主，为了满足2000 P的算力，就需要配置125台8卡H800服务器，或400台8卡A800服务器，价格分别为3亿元、5.6亿元。而且，由于H800还支持PCIe 5.0、新一代的CPU和内存等，因此需要提升价格，才能发挥其最优的算力性能。

所以，从大模型训练角度看，购买H800的总成本要低于A800，性价比更高，而且也比搭建CPU的成本要低——这也就是英伟达CEO黄仁勋最近常说的：“买的越多，省的越多”。

当然，如果你实在买不起也没关系。英伟达还贴心地推出在线租赁服务DGX超级AI计算系统，通过租赁的方式开放给企业，搭配8个H100或者是A100的GPU，每个节点640GB内存，每月租金为37000美元，从而不用自建数据中心购买大量GPU显卡。这类租赁方式毛利率很高，根据一份关于微软“云端算力租赁”服务报告显示，该业务毛利率高达42%，已成为微软新的“现金奶牛”。

那么国内市场，英博数科、商汤AIDC和其他超过11个智算中心/云厂商也有类似的服务，对于大模型来说，整体价格要比自建价格减少20%以上。

此外还有大模型训练时间。英伟达最新发布的NVIDIA L40S GPU，比A800/H800模型训练效率更高。一个70亿参数的模型，HGX A800跑完需要17个小时，而L40S速度要快1.3倍，短短半天时间就跑完了，更不用说一个1750亿参数的模型，用L40S一个周末时间就能训练完。

chatGPT

近期文章

互联网资讯 / 人工智能 · 2024年3月3日 0

中美竞争英伟达，AI芯片市场难以垄断

You may also like...

发表评论取消回复

互联网资讯 / 人工智能 · 2024年3月3日 0

You may also like...

2019年中国联通4G用户数累计净增3384.1万户

百炼智能：AI精准营销助力B2B企业开启获客新时代

黄仁勋会见印度总理，探讨AI领域潜力

发表评论 取消回复

发表评论取消回复