微软发布更新版 DeepSpeed 库,能以更少 GPU 做到“兆级”AI 模型训练

微软发布更新版 DeepSpeed 库,能以更少 GPU 做到“兆级”AI 模型训练

微软(Microsoft)11 日发布更新版 DeepSpeed 库,此深度学习优化库引进新方法训练包含上兆参数的 AI 人工智慧模型,亦即模型内部可提供预测变量。微软宣称名为“3D 平行”(3D parallelism)的技术,可适应不同的工作负载需求,以便运行超大模型,同时平衡扩充效率。

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。