全球第五大超算!特斯拉:用它训练AI 将自动驾驶成为可能

来源:财联社 作者: 时间:2021-06-23 11:16

自动驾驶 AI 特斯拉

6月23日报道,特斯拉近日推出了新的超级计算机,并成功位列全球第五大超级计算机,它也将是特斯拉即将推出的新超级计算机Dojo的“先行版本”。

据称,这一超级计算机将被用于训练为特斯拉的自动驾驶仪(Autopilot)和即将问世的自动驾驶人工智能(AI)提供动力的神经网络。

在过去的几年里,特斯拉一直把研究重点放在汽车内外的计算能力上。在内部,需要足够强大的计算机来运行它的自动驾驶软件;在外部,则需要超级计算机来训练由神经网络支持的自动驾驶软件,这些神经网络会接收来自海量车辆的大量数据。

特斯拉在过去的几年里一直在研究Dojo,该公司首席执行官埃隆·马斯克(Elon Musk)一直暗示它应该在今年年底准备好。据了解,Dojo项目由计算速度达每秒百万万亿次(exaFLOP)的超级计算机组成,使其成为全球最强大的计算机之一。

QD4uCiZ69H.png

日前,在2021年计算机视觉与模式识别大会上,特斯拉AI主管Andrej Karpath介绍了该公司的最新超级计算机。Karpathy展示了特斯拉的第三个超级计算机集群,特斯拉声称该新集群具有一些相当疯狂的参数,应该会使其成为全球第五的计算机:

1.720个80GB 8x A100 节点(共5760 个GPU);

2.1.8 EFLOPS(720节点* 312 TFLOPS-FP16-A100 * 8 gpu/节点);

3.10 PB“热层”NVME存储@ 1.6 TBps;

4.总交换容量为640 Tbps。

src=http___n.sinaimg.cn_sinacn08_389_w717h472_20181202_bf7e-hpevhcm7354895.png&refer=http___n.sinaimg.jpg

Karpathy对此评论称,“我们有一个神经网络架构网络和一个1.5 pb的数据集,需要大量的计算。对我们来说,计算机视觉是使自动驾驶成为可能的基本要素。”

“为了让它更好地工作,我们需要掌握来自车队的数据,训练大量的神经网络并进行大量实验。所以我们在计算上投入了很多。在本例中,我们展示的是使用720个80GB版本的8x A100节点构建的集群。这是一个巨大的超级计算机。我实际上认为,就每秒浮点运算次数而言,它大概是世界上第5台超级计算机。”他补充道。

这位特斯拉工程师不愿详细说明Dojo项目,但他表示,Dojo将是一台比特斯拉目前的集群更适合神经网络训练的超级计算机。马斯克此前还表示,特斯拉计划最终将其超级计算机提供给其他公司,以便它们在上面训练自己的神经网络。

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子