Meta 推出全新图像生成 AI 模型 CM3leon 提升效率

Meta 推出全新图像生成 AI 模型 CM3leon 提升效率

除了大热门生成式 AI 聊天机器人应用,图像生成 AI 模型也在进步。Meta 最近公布新图像生成 AI 模型 CM3leon,称性能再提升。

Meta 新 CM3leon 是多模态基础模型(Multi-Modal Model),输入文字可产生图像,以及反过来输入图像产生文字,可用于自动生成标题等场景。Meta 指之前文字产生图像技术主要依赖扩散模型输出图像,CM3leon 是不同方法,使用基于标记的自回归模型(Token-based Autoregressive Model)。

Meta〈扩展自回归多模态模型〉论文解释,扩散模型因强大性能和相对低计算成本,近来图像产生占主导地位,相比以前基于标记的自回归模型虽然也能产生强大结果,尤其是有更好全局图像一致性,但训练和推理成本要高许多。

这次 CM3leon 研发成果证明基于标记的自回归模型也能比基于扩散模型的方法更有效率,文字产生图像性能更强劲,训练数据运算量比以前基于变换器法少 5 倍。

  • Introducing CM3leon, a more efficient, state-of-the-art generative model for text and images

(本文由 Unwire Pro 授权转载;首图来源:Meta)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。