Stability AI 发表 Stable Diffusion 3 预览，提高文字生成图像品质

AI与大数据 1小时前 0

▼

AI 新创 Stability AI 以图像生成软件 Stable Diffusion 闻名，22 日发表下一代 Stable Diffusion 3 预览，承袭 Stable Diffusion 系列优点，能够产生更多主题的图像，并提高文字生成的品质和准确性。Stability AI 虽未公开展示操作，但已开放想尝试的用户加入等候名单。

Stable Diffusion 3 参数从 8 亿到 80 亿不等，适合在各种装置上（从智慧手机、AI PC 到服务器）执行，参数大小与这款模型可以产生多少图像细节的能力有关，较大模型需要 GPU 加速器有更多 VRAM 才能运作。

“这是使用新型的 diffusion transformer（类似于 Sora），并结合 flow matching 和其他改进”，Stability AI 执行长 Emad Mostaque 透过个人 X 帐号表示。由于利用 transformer 改进，不仅可以进一步扩展并且接受多模态输入。

自 2022 年以来，可以看到 Stability AI 推出了一系列图像生成模型：Stable Diffusion 1.4、1.5、2.0、2.1、XL、XL Turbo，直到现在 Stable Diffusion 3。Stability AI 提供更开放的方案，再到像是 OpenAI DALLE 3这样的图像生成模型，尽管用到受版权保护的训练资料、具有偏见和滥用的可能性而引发争议。Stable Diffusion 的模型开放权重且来源可用，这意味着模型可在本地端执行并进行微调，使输出更符合需求。

虽然 Stable Diffusion 3 还未能广泛开放，但 Stability AI 表示，一旦测试完成将能免费下载并在本地端执行。“与之前模型一样，这个预览会收集意见，在公开发表之前提高性能和安全性”，Stability AI 强调。

Stability announces Stable Diffusion 3, a next-gen AI image generator

（首图来源：Stability AI）

延伸阅读：

Stability AI 发表 1.6B 轻量新模型，测试表现胜过微软 Phi-2
Stable Video Diffusion 发表，可用图片产生影片
开源版 ChatGPT 要来了？AI 做图神器团队想让每个人都能做出大模型

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

AI GPU PC Sora Stability

延伸阅读：

相关文章