AI“iPhone 时刻”后,NVIDIA 打开生成式模型“魔盒”
▼
人工智慧应用“淘金潮”火热背后,总少不了 NVIDIA 的“默默付出”,最近爆红的 ChatGPT 也一样。如 CEO 黄仁勋于 GTC 2023 演讲所说,数年前正是黄仁勋亲手将有签名与一句话的全球首台 DGX 交给 OpenAI。
正是这台整合8块NVLink共享算力的H100组成的超级电脑,OpenAI才取得交出ChatGPT这张答案卷的机会。NVIDIA交货给OpenAI首台DGX AI电脑后,《财富》100强企业一半都改用DGX AI。NVIDIA 算力基础设备与人工智慧应用,俨然成为硬币不可分割的正反面。
刚结束的GTC 2023,NVIDIA又展示向人工智慧未来迈出的下一步。
人工智慧的“iPhone时刻”
生成式AI和大型自然语言模型的杀手级应用风靡全球,让人工智慧又站在新路口前,如黄仁勋GTC 2023演讲所说,人工智慧正迎接自己的“iPhone时刻”,AI硬币的另一面就是NVIDIA。
黄仁勋预测,就像iPhone使智慧手机和App普及,能产生自然文章和图片的“生成式AI”也会很快普及。“算力即权力”口号正以人们未预料的速度变成现实,但对企业和开发者来说,想获得“权力”没那么容易。
新创公司竞相构建崭新产品与商业模式,老公司也积极拥抱变化,以应付新环境。大型语言模型训练需资料中心成千上万GPU“齐心协力”,对企业来说就是场地和维护成本,要越过门槛并不容易。
不论新生血液还是老牌豪强,都在寻找更快捷的人工智慧开发流程。身为算力供应商的NVIDIA已发觉新需求,并推出云端人工智慧DGX Cloud。DGX Cloud提供专用计算集群,每个DGX Cloud配备8个NVIDIA H100或A100 80GB Tensor Core GPU,共640GB GPU记忆体,用户可按月租用计算资源,简单Web浏览器即可存取,降低本地部署和管理基础设施的成本,增加AI便捷性。
黄仁勋描述产品远景时这样说:“透过浏览器就能将DGX AI超级计算机立即接入公司。”
这并非空中楼阁,GTC 2023演讲时黄仁勋宣布,NVIDIA将与云端业者合作托管DGX云端基础设施,已与甲骨文达成合作,甲骨文OCI RDMA Supercluster提供可扩展超过32,000个GPU的超级集群。微软Azure预定下季开始托管DGX Cloud,很快Google Cloud也会加入行列。
打开生成式AI“魔盒”
iPhone问世后没有止步不前,一路引领智慧手机长达数十年发展,如今也到“iPhone时刻”的AI,面对的也与当年iPhone极其相似的世界。ChatGPT的成功,对AI革命而言仅是踏入门口一小步,门后是生成式AI更广阔的世界。
基础设施之外,想掌握AI“原力”的企业来说,如何搭上AI下一班车,建立生成式AI模型,并应用至生产也是重要命题。NVIDIA新云端服务平台NVIDIA AI Foundations正是让企业做到这点的“神兵利器”。NVIDIA AI Foundations分为客制语言文本Nemo、视觉语言制作Picasso和医学专门模型Bionemo三部分。
Nemo客户可引入自家模型,或使用Nemo从GPT-8、GPT-43到GPT-530等数十亿参数的预训练模型,并构建可掌控的语言模型。Picasso提供消费者大量有授权许可的专业图片和影像素材,使用许可内容或根据自家内容训练自定义模型,并将生成内容导入编辑工具,甚至能导入NVIDIA元宇宙平台Omniverse,参与“元宇宙”大基建。
提供语言、视觉和生物学等领域模型制作服务,适用需构建、改善和操作自定义LLM的客户及专用资料库训练的生成AI,以及针对特定领域任务,Bionemo使用者既能即时存取药物研发流程,也能用于蛋白质结构预测和蛋白质生成与分子生成、分子对接等新药研究关键步骤的模型。
NVIDIA不仅将三者合一的NVIDIA AI Foundations视为云端服务,更视为构建生成式AI模型的“代工厂”。
GPU反客为主,晶片关键步骤“抢班夺权”
要真的跨过AI下次进化的大门,最重要的“基建设备”GPU晶片制造当然非常重要。人工智慧大红离不开GPU助力,提供大量执行重复简单计算的GPU对需要大量算力的大模型和神经网络来说,是命定的伴侣。
前几年人工智慧小小掀起工业浪潮,小至餐厅补货,大到码头或光伏电站,人工智慧成为工业领域公认的“先进产能”。但兜兜转转,GPU领头者NVIDIA终于把人工智慧触手带回“原点”:GPU晶片制造。
黄仁勋提到,随着晶片制程进步,如今晶片要求约一个金原子或一条人类DNA链尺寸误差,晶片制造核心步骤和起始阶段的曝光更是重中之重。30年前电晶体尺寸就比曝光机波长更小,由于衍射效应,掩膜图案与最终图案特征完全不同,使类比光透过光学元件和光阻剂互相作用结果的计算曝光成为晶片制造设备重要的一环。
▲ 掩膜图案与最终特征完全不同。
以前CPU承担主要工作,黄仁勋估算,每年晶片商在这步骤消耗数百亿CPU小时算力创建曝光系统掩范本,但先进制程发展到现在计算曝光更复杂,CPU负载举步维艰。多次高呼“摩尔定律已死”的黄仁勋故宣布人工智慧与晶片制造结合的最新成果:基于晶片制造的NVIDIA cuLitho软件库,找到晶片制造的新“活路”。
NVIDIA表示,cuLitho加持下,短期就可提升晶片产业链效率,大幅降低功耗,新流程仅需500块H100就能完成传统流程4万个CPU系统才能完成的工作,让曝光性能跃升40倍。比起现有流程,cuLitho能仅用九分之一功耗达成每天3~5倍生产效率,也能一夜之间做完传统两星期才能完成的单个掩范本任务。
长远看,NVIDIA有更远大目标。不仅将与台积电、新思科技合作,将NVIDIA cuLitho软件库整合到系统,制造最新Hopper架构GPU,黄仁勋还宣布与台积电、艾司摩尔与新思科技合作,使用cuLitho为2奈米以后更先进制程晶片打好基础,为AI“iPhone时刻”后革命准备好足够“粮草”。
(本文由 雷锋网 授权转载;首图来源:NVIDIA)
延伸阅读:
- 辉达携 3 大厂加快微影制程、剑指 2 奈米,台积 ADR 嗨
- ChatGPT 爆红拉抬 NVIDIA 与供应链,下周 NVIDIA GTC 受瞩
- 瑞信:AI 晶片之王 NVIDIA 护城河无敌,股价再涨 18%
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。