搭载 Nvidia H100 GPU,Google 推出 A3 超级电脑虚拟机器

搭载 Nvidia H100 GPU,Google 推出 A3 超级电脑虚拟机器

近来大型语言模型和生成式 AI 兴起,需要大量算力训练模型、运算 AI,为此 Google 在开发者大会上发表 A3 超级电脑虚拟机器(virtual machine,VM)。

“A3 GPU VM 专为现今机器学习工作负载提供最高性能的训练,配备最新 CPU、改善的主机记忆体、下一代 Nvidia GPU 以及主要网络升级”,Google Cloud 官方部落格文章指出,新的虚拟机器配备 Nvidia H100 GPU,能与专门的资料中相互结合,以获得高吞吐量和低延迟的庞大算力。

A3 VM 的关键规格包括 8 个具 Nvidia Hopper 架构的 H100 GPU、第 4 代 Intel Xeon 可扩展处理器、2TB 主机记忆体,及在 8 个 H100 GPU 之间透过 Nvidia NVSwitch 和 NVLink 4.0 达到 3.6TB/s 对等频宽。

A3 VM 可以提供高达 26 exaFlops 的运算功率,应有助于训练更大型的机器学习模型,并减少训练时间和成本。更重要的是,这些虚拟机器的工作负载在 Google Cloud 专门的 Jupiter 资料中心网络架构中运行。

Google Cloud 将以几种方式提供 A3 VM,包括客户自己运行,或者将其做为托管服务,Google 会为他们处理大部分繁重的工作。客户自己动手运行 A3 VM 涉及了 Google Kubernetes Engine(GKE)和 Google Compute Engine(GCE),而采取托管服务是在 Google 的全托管机器学习平台 Vertex AI 上运行 A3 VM。

A3 VM 可为 Google Cloud 客户提供庞大算力,满足更高的工作负载,无论是涉及复杂的机器学习模型还是运行生成式 AI 背后的大型语言模型,皆能带来成本效益。

  • Google Cloud announces new A3 supercomputer VMs built to power LLMs

(首图来源:Nvidia)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。