AI领域算力竞争升级：英特尔、谷歌推出超强芯片对抗英伟达

目前，AI技术潜力并没有完全释放出来，去年仅10%的企业推出生成式AI方案。

北京时间4月10日凌晨，美国亚利桑那州Intel Vision 2024会议上，芯片巨头英特尔（Intel）发布性能最强的新一代Gaudi3 AI 加速芯片，以及全新的下一代英特尔至强6处理器等产品。

其中，英特尔Gaudi 3 AI芯片采用台积电5nM工艺，支持128GB HBMe2内存。相比上代产品，英特尔Gaudi 3带来4倍（400%）的BF16 AI计算能力提升，1.5 倍的内存带宽以及 2 倍的网络带宽提升。同时，在AI模型算力中，相比于英伟达H100 GPU，Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%，平均性能提高 50%，能效平均提高40%，而成本仅为H100的一小部分。

英特尔预计，Gaudi 3将于2024年第二季度起出货，戴尔、惠普、联想、超微电脑等企业将成为首批客户。

与此同时，今晨举行的谷歌云年度大会Cloud Next 2024上宣布推出一款基于ARM架构的服务器芯片Axion，其性能比通用ARM芯片高30%，比英特尔生产的x86最新芯片性能提高50%。谷歌旨在减少对英特尔和AMD x86芯片的依赖。

全球围绕 AI 算力战争已经拉开帷幕。

“现在的半导体竞争是一场产业战争，也是一场全面的国家战争。”韩国总统尹锡悦4月9日宣布该国全面押注 AI 半导体发展，投入9.4万亿韩元（约合500亿元人民币），以帮助韩国成为与中国、美国并驾齐驱的全球三大AI半导体国家之一。

英特尔突袭英伟达H100

新AI芯片训练快40%，推理快50%

就在深夜，英特尔CEO帕特·基辛格（Pat GelsingeR）手舞足蹈地亮出了最新AI芯片——Gaudi3。

新一代Gaudi 3 AI加速器专为高性能、高效率的生成式 AI 计算而构建，每个加速器都具有独特的异构计算引擎，由 64 个 AI 定制和可编程TPC和 8 个 MME 组成，每个Gaudi 3 MME 都能够执行 64000个并行运算，支持128 GB HBMe2 内存容量、3.7 TB 内存带宽和 96 MB 板载静态随机存取内存 (SRAM) 。

同时，每个Gaudi 3当中都集成24个200 Gb以太网端口，提供灵活且开放标准的网络。而Gaudi 3 的PCIe 功率为600w，带宽为每秒 3.7TB。

性能方面，模型训练层面，Gaudi3比英伟达H100快40%；推理层面Gaudi3比英伟达H100快50%。即便相比最新英伟达H200，Gaudi3 AI芯片的推理速度竟然也提升了高达30%。

实际上，随着ChatGPT爆火，AI 模型、数据、算力基础设施成为生成式 AI 技术发展的三大要素。

据Gartner数据显示，2024年，企业在生成式 AI 方向上预期支出达400亿美元，到2027年这一数据增至1510亿美元。与此同时，到2026年，企业对生成式 AI 使用程度达80%，同时至少有50%的边缘计算部署将与AI、机器学习（ML）等方向有关。

然而，AI 技术的全部潜力并没有完全释放出来。仅10%的企业组织去年推出面向生产的生成式 AI 方案；同时，有46%的的专家指出，基础设施是将大模型产品化的最大挑战。

因此，英特尔希望能够利用长期的 AI 技术积累，通过开放生态系统的力量，乘上 AI 热潮。与英伟达部分类似，英特尔也将提供一整套 AI 算力基础设施方案，从而“解锁”企业 AI，推动生成式 AI 的广泛应用和快速商业化，有望帮助企业应对 AI 项目时所面临的挑战。

基辛格在会上表示，到2030年，半导体市场规模将达1万亿美元，而 AI 是其中的主要推动力。

从整体路线图来看，AI PC、Edge AI（边缘）、Data CenteR AI（数据中心）将成为英特尔三大重要的计算生态系统，比英伟达覆盖面积更广，加上其开放、可扩展的软件和算法特性，广泛适用于多个 AI 领域，从而推动英特尔持续为企业客户打造全新 AI 方案。

具体到技术产品层面，除了英特尔Gaudi3之外，此次开幕活动上还公布了其他四个方向的重要进展：

1、全新英特尔至强6处理器品牌，应用于数据中心、云和边缘场景。

其中，与第二代至强处理器相比，配备能效核（此前代号为SieRRa FoRest）的全新至强6处理器每瓦性能提高2.4倍，机架密度提高2.7倍，客户能以近3:1的比例替换旧系统，大幅降低能耗，预计将于2024年第二季度推出；而配备性能核的英特尔至强6处理器，可将下一个令牌（Token）的延迟时间最多缩短6.5倍，能运行700亿参数的LlaMa2模型，预计不久后推出。

2、预览下一代英特尔酷睿UltRa处理器。英特尔宣布将推出下一代酷睿UltRa客户端处理器家族（代号LunaR Lake），将具备超过100 TOPS平台算力，以及在神经网络处理单元（NPU）上带来超过46 TOPS的算力，从而为下一代AI PC提供强大支持。据悉，英特尔预计将于2024年出货4000万台AI PC设备。

3、面向网络互连层面的新品部署。与NVlink一样重要，通过超以太网联盟（UEC），英特尔公布面向AI高速互联技术（AI FAbRics）开放技术的以太网解决方案，利用高速互联技术支持AI模型训练和推理，产品组合包括英特尔AI网络连接卡（AI NIC）、集成到XPU的AI连接芯粒（ChIPlet）、基于Gaudi加速器的系统，以及一系列面向英特尔代工的AI互联软硬件参考设计。

4、全面更新的边缘计算和TibeR业务组合。英特尔还发布新的Edge芯片产品，包括酷睿TM UltRa、酷睿TM、凌动处理器以及面向Edge的英特尔ARcTM GPU，预计所有新品将于本季度上市，应用于包括零售、工业制造、医疗保健等关键领域，并将于今年获得英特尔TibeR边缘平台的支持。另外，英特尔还发布TibeR业务解决方案组合，以简化企业对生成式 AI 软件服务的部署工作，预计TibeR方案将于今年第三季度全面推出。

英特尔披露，截至目前，英特尔边缘计算处理器销量达2亿块，已边缘部署超过9万个解决方案。

另外，英特尔还宣布联合Hugging FACE、RedHat、SAP、VMwaRe等15家公司，将共同创建一个开放、多供应商的生成式AI系统平台，通过RAG（检索增强生成）技术，提供运行大量现存专有数据源得到增强版开放大模型。

英特尔强调，公司不仅将提供包括硬件、软件、框架和工具，而且希望设备制造商、数据库提供商、系统集成商、软件和服务提供商等参与其中，推动英特尔AI开放生态系统的构建，以及将生成式AI技术进行场景落地。

总体来说，基于英特尔5nM Gaudi3 AI芯片，以及至强6处理器和软件栈，该公司正逐步构建 AI 领域的算力基础设施生态，全面挑战英伟达以及现有 AI 芯片市场格局。

英特尔方面去年7月对钛媒体app表示，市场需要替代品。客户非常欢迎英特尔Gaudi方案在向大众部署 AI 方面发挥重要的领导作用。“几十年来，英特尔一直致力于把新的技术普及、普惠到各行各业。通过降低进入门槛，提高市场参与度，从而加快创新速度。”

基辛格在会上强调，“创新技术正在以前所未有的速度发展，每家公司都在加速成为AI公司，这一切都需要半导体技术提供支持。从PC到数据中心再到边缘，英特尔正在让AI走进千行百业。”

为减少对英伟达依赖

谷歌推出ARM服务器芯片

与微软、亚马逊一样，谷歌也推出了多款自研芯片，以减少对英伟达GPU芯片的依赖。

美东时间4月9日周二，谷歌在今年的年度云计算大会Cloud Next 2024上宣布推出一款基于ARM架构的数据中心芯片Google Axion，以及更新TPU V5p芯片。

谷歌表示表示，Google Axion处理器基于ARM NeOVeRse V2 CPU构建，以TITaniuM为基础，性能比通用ARM芯片高30%，而且比英特尔生产的当前一代 x86芯片高50%。预计Axion用于多种谷歌服务，并在“今年晚些时候”向公众开放。

谷歌云副总裁兼计算和机器学习基础设施总经理 MaRk LoHMeyeR 表示：“我们正在让客户轻松地将现有工作负载转移到 ARM。Axion 建立在开放基础之上，在任何地方使用ARM的客户都可以轻松采用 Axion，而无需重新架构或重新编写应用程序。”

“谷歌推出的新型 Axion CPU 标志着交付定制芯片的一个重要里程碑，该芯片针对谷歌的基础设施进行了优化，并构建在我们的高性能 ARM NeOVeRse V2 平台上。数十年的生态系统投资，再加上 Google 的持续创新和开源软件贡献，确保为在各地运行 ARM 的客户最重要的工作负载提供最佳体验。”ARM 首席执行官 Rene Haas表示。

事实上，Axion 只是众多定制发一份芯片中的最新产品。自2015年以来，谷歌已经发布了五代张量处理单元（TPU）；同时，2018年，谷歌发布了第一个视频编码单元 (VCU)，视频转码效率提高了33 倍；另外，2021年，谷歌通过投资“片上系统”(SoC) 设计，加大了定制计算的投入，并发布了用于移动设备的三代TensoR芯片中的第一款。

如今，谷歌推出新的芯片意味着，该公司正在追赶亚马逊和微软这些云领域竞争对手的步伐。亚马逊和微软2021年就已经推出ARM架构的CPU，作为提供差异化计算服务的一种方式。而谷歌之前为YouTube、AI及其智能手机推出过定制芯片，但还没有打造过CPU。

具体来说，Axion将适用于一系列任务，包括支持谷歌的搜索引擎和 AI 相关的工作。谷歌表示，该芯片可以通过帮助处理大量数据并为数十亿用户部署服务，在AI领域发挥重要的支持作用。同时，未来谷歌逐步转移到基于ARM云服务器用例上使用，Datadog、Elastic、OpenX 和 Snap都计划采用 Axion。

除了Axion之外，谷歌还宣布全面推出 TPU V5p，用于训练和推理的最强大、可扩展且灵活的 AI 加速器，其计算能力是上一代的 4 倍（400%）。

谷歌CEO桑达尔·皮查伊表示，生成式 AI的进步需要强大的底层基础设施。谷歌 AI 超级计算机结合了我们的 TPU、GPU、AI 软件等，

chatGPT

近期文章

互联网资讯 / 手机数码 · 2024年4月12日 0

AI领域算力竞争升级：英特尔、谷歌推出超强芯片对抗英伟达

You may also like...

发表评论取消回复

互联网资讯 / 手机数码 · 2024年4月12日 0

You may also like...

真我GT5 Pro发布：同级别最强主摄登场

咖啡越平价，瑞幸越兴旺

《荒野大镖客：救赎2》Steam版预售开始

发表评论 取消回复

发表评论取消回复