Meta 首度公开自研 AI 晶片,估 2025 年正式问世

Meta 首度公开自研 AI 晶片,估 2025 年正式问世

Facebook 母公司 Meta 加入 Google亚马逊、微软的半导体大战,首度公开自行研发 AI 晶片进展。

Meta 正在打造特别为 AI 设计的基础设施架构,涵盖硬件与软件堆叠的各个层面,以及串联这些技术的客制化网络,包括 Meta 第一款用于执行 AI 模型的客制化晶片、针对 AI 最佳化的资料中心设计,以及目前进展至第二阶段的 AI 超级电脑。

名为 Meta Training and Inference Accelerator(MTIA)的全新 ASIC 晶片,是 Meta 第一款自行研发的客制化晶片,宣称运算效能和处理效率胜过 CPU,专门用于处理与 AI 推荐系统相关的工作,帮助用户找出最佳贴文内容并更快呈现在你眼前。Meta 在 2020 年开发出第一代 MTIA(MTIA v1),采用台积电 7 奈米制程。而据国外媒体 TechCrunch 报道,MTIA 至少要到 2025 年才会正式问世、投入服务当中。

▲ Meta 执行长祖克柏亲自展示 MTIA。

除了 MTIA,Meta 自行研发另一款晶片,是称为 Meta Scalable Video Processor(MSVP)的 ASIC 晶片,以支援持续成长的影音内容处理需求,最终希望将大部分成熟且稳定的影音内容处理工作交由 MSVP 执行。

Meta 首度公开自研 AI 晶片,估 2025 年正式问世 AI与大数据 图2张

▲ 另一款自研晶片 MSVP。

至于 Meta 新一代资料中心设计除了将支援现有产品以外,更将协助未来新的 AI 硬件展开训练和推理。新的资料中心针对 AI 最佳化,支援液体冷却式 AI 硬件设备和高效 AI 网络,将数千个 AI 晶片串联在一起形成资料中心规模的 AI 训练集,能与 MSVP 等新硬件设备相辅相成。

Meta 的 Research SuperCluster(RSC)AI 超级电脑,可训练新一代大型 AI 模型以支援新的 AR 工具、内容理解系统、即时翻译技术等等,它配备 16,000 个 Nvidia A100 Tensor Core GPU( 2,000 个 Nvidia DGX A100 系统)。从去年开始 RSC 参与各项研究计划,例如 Meta 推动的大型语言模型 LLaMA(Large Language Model Meta AI)。

除了日前宣布将生成式 AI 运用在广告工具上,Meta 也计划调整程式编写方式,透过内部开发的生成式 AI 程式编写辅助工具 Code Compose,提升开发者的工作效率。

自 2016 年以来,Google 一直在设计和部署称为 Tensor Processing Units(TPU)的 AI 晶片,用于训练生成式 AI 系统如 PaLM-2、Imagen 等,亚马逊则向 AWS 客户提供 AWS Trainium、AWS Inferentia 两款自研晶片进行应用,微软也传出正与 AMD 合作开发一种名为 Athena 的 AI 晶片。

Meta 过去主要使用 CPU 以及用于加速 AI 演算法而设计的客制化晶片来处理 AI 运算工作,为了扭转局面,Meta 开始自行研发客制化晶片,并与同样向 AI 领域投入大量资源的 Google亚马逊、微软等竞争。

  • Meta bets big on AI with custom chips — and a supercomputer

(首图为 MTIA v1,图片来源:Meta)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。