辉达黄仁勋的豪赌:走在破产边缘,打造上兆元 AI“军火商”
▼
营收翻两倍至 181 亿美元,利润从去年同期 6.8 亿飙升至 92 亿美元。AI 浪潮下,辉达第一季以超于期待的“爆炸”表现,从台积电手上夺走桂冠,成为“晶片之王”。
“人工智慧领域正在打仗,而辉达是唯一军火商”,华尔街分析师评论。
辉达今天享受的“AI 红利”,来自黄仁勋十多年前的“豪赌”。《纽约客》最近深度报道,可看到这场决定性豪赌背后更多细节。从来没法为成功打包票,破产永远在旁边等着。
点燃人工智慧的“大爆炸”时刻
那是第一台 8K 解析度游戏机,占据整面墙,太美了。
2000 年史丹佛学生 Ian Buck 连结 32 张辉达 GeForce 显示卡,外加八台投影机玩〈雷神之锤〉,自己做了一台高清游戏主机。辉达 GeForce 成功一开始就是〈雷神之锤〉帮助,“死亡竞赛”模式 GPU 平行运算让玩家有速度优势,故 GeForce 每次出新品都会有玩家跟上。Buck 也好奇,除了让投手榴弹速度再快点 GeForce 还能做什么,故骇进显示卡原始程式设计工具“着色器”(shader),用并行计算将 GeForce 变成低成本超级电脑。
没多久,Buck 就变成辉达员工。
▲ Ian Buck 现在是辉达副总裁。(Source:辉达)
黄仁勋想请 Buck 做一套软件,让每张 GeForce 都变成超级电脑,也让硬件团队晶片结构跟着改造。2006 年 Buck 设计 CUDA 推出,支援研究员和程式设计人员用程式语言更个人化和高效使用 GPU 的运算力。但消费者对黄仁勋想普及的超级电脑没兴趣,硅谷科技Podcast“Acquired”如此评论:
他们为新晶片架构花费巨资。
他们花了几十亿美元,目标是服务学术和科学计算的小众领域,当时还不是很大的市场,规模一定比投资的几十亿少。
辉达虽广撒网,努力寻找目标客群,试过股票交易员、石油探勘公司、分子生物学家等等,但并没有考虑过人工智慧领域。连“AI 教父”主动“上门”都没有感觉。这也难怪。
▲“AI 教父”Geoffrey Hinton。(Source:Ramsey Cardy / Collision via Sportsfile, CC BY 2.0, via Wikimedia Commons)
今日人称 Geoffrey Hinton 为“AI 教父”,但 2009 年 Hinton 是在资本嫌弃的 AI 领域研究小众“神经网络”。Hinton 当年给辉达的信这样写:
我刚对上千位机器学习研究员说,他们都该去买辉达显示卡。你们可以免费给我一张吗?
结果?辉达当然是拒绝。
Hinton 曾试用辉达 CUDA 平台训练神经网络辨识人类语言,发现成果品质比想像好很多,于是决定于产业会议示范。虽然辉达不肯给 Hinton 显卡,但 Hinton 依旧鼓励学生使用,最关键就是他门下两位也很有名的程式设计师 Alex Krizhevsky 和 Ilya Sutskever。
眼尖读者应该发现了,后者就是 OpenAI 首席科学家,ChatGPT 技术主导者。
2012 年,Sutskever 和 Krizhevsky 买了两张辉达 GeForce 显卡,一周内喂神经网络数百万张图片,训练出“AlexNet”。Sutskever 回想:
GPU 出现了,感觉就像奇迹。
他的感叹不无理由。同年 Google 购买一万六千多张 CPU 训练神经网络,以辨识猫咪影片,AlexNet 却能正确辨识电动车、猎豹、货船等,只用到两张 GPU。
2012 年仍相当权威的大规模视觉辨识挑战赛(ImageNet Large Scale Visual Recognition Challenge),AlexNet 以 Top5 误差 15.3% 成绩夺冠,表现远优于第二名和历届参赛者,出众到一度怀疑是作弊。Hinton 评论:
那就是宇宙大爆炸时刻。模范式转变。
虽然不是刻意为之,但辉达就这样引发人工智慧的“大爆炸”时刻。
成为 AI 公司
(黄仁勋)周五晚上寄信,表示公司将围绕深度学习展开,我们不再是图像处理公司。
之后星期一清晨,我们就变成 AI 公司。
真的,就是那么快。
辉达副总裁 Greg Estes 告诉《纽约客》。AlexNet 登场后,没过几年,几乎所有参加大规模视觉辨识挑战赛的人都选神经网络。到 2010 年代中期,GPU 训练的神经网络图片辨识准确度达 96%,甚至超过人类。黄仁勋的超级电脑愿景成真,他开始找下一个目标:
我们能解决电脑视觉问题,完全无组织结构的问题,这事实指向另一个问题:“你还能教它什么东西?”
黄仁勋内心的答案似乎是:一切。
他认为神经网络会改变社会,他也可用 CUDA 垄断硬件市场。他纵身一跃,开启辉达的 AI 征途,这次 AI 界领导者不再需要写信给辉达要免费显卡了。2016 年 8 月,黄仁勋亲自将世界首台 DGX-1 送至 OpenAI 办公室,当时世界都不知道与 OpenAI 决裂的马斯克亲自开箱三千人耗时三年打造的成果。
(Source:MIT Technology Review)
官方新闻稿黄仁勋开玩笑:
如果这是我们唯一出货的产品,造价就会高达 20 亿美元。
谁能想到,第二年 Google 就公布新神经网络训练架构 Transformer。新突破再被 Sutskever 抓住,引领 OpenAI 建造第一个 GPT 模型,一切都建立在辉达超级电脑基础上。一年前的今天,OpenAI 发表 ChatGPT,改变一切,也包括辉达。
订单不止,供不应求。
今年辉达股价飙升超过 200%,成为全球首家市值破兆美元的晶片制造商。曾不被看好的 CUDA 也集合 400 万名开发者,成为辉达 AI 领域的另一道护城河。无论航太、生物科学、机械或能源探索等,大部分都用 CUDA 进行。
辉达最新 AI 产品 DGX H100 是重达 370 磅的金属盒,定价高达 50 万美元。和送到 OpenAI 办公室的 DGX-1 相比,新产品运作速度提升五倍,要从头训练出 AlexNet,一分钟就可搞定。
总是“在破产边缘”的成功者
9 月黄仁勋受邀回加州圣荷西那家丹尼餐厅。当年他就是在这家餐厅卡座和合伙人起草成立辉达,他们想设计让竞争对手“嫉妒死”(green with envy)的晶片。黄仁勋想出“Nvidia”之名,融合拉丁文“嫉妒”(invidia)之意。现在辉达当然让竞争对手眼红,丹尼 CEO 都特意为他们做了一块纪念牌,让辉达的光也能照耀餐厅。
然而,辉达成功并不是典型故事。
辉达初成立时,喜欢电子游戏的黄仁勋认为游戏市场值得拥有更好显卡,1995 年推出首款产品 NV1。但 NV1 没有被主流市场接受过,一大原因在同年微软推出 D3D API,但 NV1 不支援 D3D。下一代 NV2 也失败了。“赌”输一次的黄仁勋不服气,1996 年辞退一半员工,收紧资金,全押未经测试的新产品:
机率一半一半,但无论如何我们都在破产边缘。
当 RIVA 128 开售,辉达剩下现金只够付一个月开支。所幸 RIVA 128 大成功,四个月就售出上百万张,那时起黄仁勋就开始鼓励员工带着这种“绝望”工作。因对黄仁勋而言,困境和失败并不陌生:
我发现,我在困境中想事情最清楚。
心率甚至会下降。
他甚至坚持“失败一定要分享”。辉达曾出货有问题显卡,风扇运转超级吵。黄仁勋没有炒掉产品经理,而是开一场大会,聚集几百人,让经理分析每个导向这次失败的决策。展现“失败”,也成了辉达的“习俗”。
你也可以很快看出,谁会留下,谁不可以。
如果有人开始充满防御心,我就知道他们待不久了。
辉达软件负责人 Dwight Diercks 说。
黄仁勋也喜欢鼓励员工追求“0 亿美元市场”(zero-billion-dollar market),挑战不仅没有对手,甚至连明确顾客都没有的实验性领域。毕竟如黄仁勋所言:
我一直觉得我们离破产只有 30 天。这点从来没变。
没什么理由不拼命。
(本文由 爱范儿 授权转载;首图来源:辉达)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。