互联网资讯 / 人工智能 · 2024年4月2日 0

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

全球最快的AI训练速度王座,刚刚易主了。

马斯克治下的特斯拉,自研AI训练芯片D1,自研AI超级计算机Dojo ExaPod,首秀即巅峰,登场就是全球第一。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

此外,马斯克还带来了另一个特斯拉新品:

汽车机器人,搭载了特斯拉包含芯片在内的软硬件系统,但跟百度的不同,不像汽车更像人。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

特斯拉自研AI训练芯片D1发布

马斯克说:要有一个超快的计算机来训练Autopilot在内的整个自动驾驶系统。

于是DOJO诞生了。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

DOJO,取名源自日语里“练武”专用的道场,顾名思义,DOJO就是特斯拉AI不断精炼功夫的道场。

DOJO 是一种通过网络结构连接的分布式计算架构。它还具有大型计算平面、极高带宽和低延迟,以及分区和映射的大型网络。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

实际上,在CVPR 2021现场,特斯拉就已经剧透过DOJO的相关性能。

当时总算力达1.8EFLOPS,读写速度高达1.6TBps,一度被认为超越全球排名第一的超级计算机富岳,创造超算新纪录。

但那时DOJO用的是英伟达的A100 GPU,单卡算力321TFLOPS,共计5760张,节点数高达720个。

而现在,DOJO更进一步,自研了“心脏”оƬ。

特斯拉首款AI训练芯片D1,正式发布。

7nM工艺,单片FP32达到算力22.6TOPs,BF16算力362TOPs。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

特斯拉发布会现场,还用图展示性能,拳打英伟达GPU,脚踢谷歌TPU。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

一句话概括,比现在市面上任何芯片都强。

特斯拉也用“PuRe learning MacHine”,纯学习机器,来称呼D1芯片。

此外,D1芯片强的不只是单兵作战能力,还有集团军作战能力,它们可以无缝融合,变成超大规模计算阵列。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

能有多大,接下来,特斯拉就揭晓了之前预热海报上的“神秘物种”:

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

集合了25块D1芯片的训练模块!

这也是特斯拉首个训练模块,而把多个模块集合,就能形成更大算力的训练阵列:

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

至此,特斯拉自研超算DOJO完整真身亮相!

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

超过50万个训练节点。每个模块算力为9 petaflops,带宽为36TB/s。

DOJO的可怕之处在于,不同于世界其他超算需要承担多种不同任务,DOJO的唯一使命就是AI训练,或者可以说聚焦到自动驾驶算法的训练。

因为专注,所以首秀即巅峰。

AutoPilot、FSD,特斯拉的其他AI训练任务,都能在DOJO里更高效练就。

另外,特斯拉官方还继续剧透:这不是终点,下一代DOJO还会有10倍性能的提升!

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

所以到这里就完了?拿衣服。

最后也是最强,特斯拉D1支持下的终极大杀器登场:

ExaPOD,集成120个训练模块,包含3000个D1芯片,超过1百万个训练节点。算力达到1.1EFLOP。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

而且每单位能耗下的性能比当今最强超算高1.3倍,但碳排放仅为1/5。

速度和性能,冠绝业内。

于是特斯拉明确:这就是全球最快的AI训练计算机。

有意思的是,2019年美国能源部曾放言要花6亿美元建E级算力的超算,2023年问世&hellIP;&hellIP;

万万没想到,这个目标被“车企”特斯拉率先实现了。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人最强“炼丹炉”为谁而建?

所以问题来了,自研D1芯片有了,最强AI训练超算DOJO Ready了,接下来特斯拉会有怎样的改变?

特斯拉AI技术主管AndRej KaRpathy(李飞飞高徒)登场,介绍了D1芯片和DOJO,主要服务的对象—”灵丹妙药”:

纯视觉方案。

事故频出,争议四起,甚至中国绝大部分玩家都转向了视觉+激光雷达的综合方案,但特斯拉依然坚持。

KaRpathy详细介绍了特斯拉高纯视觉方案的思路,和现行8摄像头方案的特点,以及它为什么能work。

特斯拉纯视觉方案,基本构建原则是把自动驾驶系统看作一个生物,有眼睛、有神经、有大脑。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

目前的方案有八个摄像头,背后是被称为HydRaNets—”九头蛇网络”的多任务学习神经网络。

“九头蛇网络”可以同时处理目标检测、交通标志识别、车道预测等等任务,其关键在于对各种数据的特征提取,包括不同种类数据的特征共享、对不同任务的分别调参,以及参数缓存,用来加快调参速度。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

这也是实现FSD敏捷开发,半年内迭代2-3个版本的关键。

接下来,KaRpathy 描述了纯视觉方案的历史,以及方案发展到今天的逻辑,他展示了一段特斯拉处理其图像数据的视频。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

他说过去 的FSD 虽然很好,但事实证明这样的系统不够完善,每个摄像头能够检测到工程师预期的目标,但背后神经网络的矢量空间是不够的。

于是,特斯拉如重新设计了神经网络,就是上面的“九头蛇”。

另外相机校准、缓存、队列和优化等等环节都做了最大程度简化。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

特斯拉方面还比较了多摄像头方案和单摄像头方案的差别,相同的场景下,单摄像头方案识别率明显低于多摄像头方案。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

特斯拉车辆上的8个摄像头获取原始输入后,系统会创建各种分辨率的图像,用于各种功能和目的。

这些不同的图像会被分别喂给处理不同任务的神经网络,作为整个自动驾驶系统的决策依据。

马斯克发布全球超快AI计算机,类似“钢铁侠”的机器人

接着,KaRpathy介绍了特斯拉的“终极