特斯拉启动 AI 超级电脑,万颗 H100、Dojo 同时运行
▼
市场传出,特斯拉(Tesla Inc.)28 日启动众所瞩目的超级电脑,准备用于各式人工智慧(AI)应用,其运算能力特别强大、甚至可用来执行高效能运算(HPC)任务。事实上,这款基于辉达(Nvidia Corp.)“H100”晶片的超级电脑,将成为全球最强大的电脑之一。
爆料可信度一向很高、也是特斯拉投资人的Sawyer Merritt透过社交平台X指出,特斯拉28日启动万颗H100 GPU丛集,协助训练全自动辅助驾驶(FSD)系统。H100 GPU运算效能是前代A100五倍快,可加速特斯拉训练FSD,训练成果也会比过去更优秀。不过H100 GPU非常贵,单颗要价近4万美元。
Merritt指出,由于辉达无法追上市场GPU需求,特斯拉只能斥资十多亿美元打造自家超级电脑“Dojo”。Dojo使用高度最佳化客制晶片,2024年有望成为全球最强大超级电脑,负责训练特斯拉车队并处理车队传回资料。马斯克(Elon Musk)7月表示“老实说,若辉达交出足够GPU,我们也许不需要Dojo。”
Merritt表示,特斯拉的辉达H100 GPU丛集与Dojo将同时启动,大幅拉升特斯拉运算能力,目前没有任何汽车业者能匹敌。Merritt并附一张图,显示特斯拉预测Dojo运算能力有机会2024年10月达100Exa-Flops。
Tomorrow, @Tesla will turn on a massive and very expensive 10,000 unit NVIDIA H100 GPU cluster to help it train FSD. But that got me wondering, what is the difference between these new H100 GPUs and the older A100 graphics processing units (GPUs) Tesla has been using for the last… pic.twitter.com/ZoCjR1SdjI
— Sawyer Merritt (@SawyerMerritt) August 28, 2023
Merritt并指出,特斯拉的FSD V12版终端对终端训练已触及运算瓶颈,但会积极确保未来不会如此。据马斯克说法,特斯拉光今年就耗资超过20亿美元训练运算力,2024年也同样。
Tom’s Hardware报道,特斯拉AI推论兼AI平台工程经理Tim Zaman 27日解释,真实世界影片训练,特斯拉拥有也许是世界最大训练资料库,快取热层容量超过200PB,数量级(orders of magnitudes)比大型语言模型(LLMs)还高。
Tesla AI 10k H100 cluster, go live monday.
Due to real-world video training, we may have the largest training datasets in the world, hot tier cache capacity beyond 200PB – orders of magnitudes more than LLMs.
Join us!https://t.co/F4A0Qb0CXG— Tim Zaman (@tim_zaman) August 26, 2023
万颗H100 GPU丛集对技术性运算的效能峰值可达340 FP64 PFLOPS,对AI应用的效能峰值则可达39.58 INT8 ExaFLOPS。相较之下,Leonardo旗下全球第四优秀超级电脑效能仅304 FP64 PFLOPS。
(本文由 MoneyDJ新闻 授权转载;首图来源:shutterstock)
延伸阅读:
- 马斯克:努力扫货辉达 GPU,超钦佩黄仁勋
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。