Stable Diffusion 3：Stability AI推出的最新图像生成模型

AI图像工具 3天前 0

▼

Toggle

Stable Diffusion 3是什么？

Stable Diffusion 3 是由Stability AI推出的最新文本到图像模型，模型参数范围从 800M 到 8B，可适配不同类型设备，并称是迄今为止“最强大的文本到图像模型”。

Stable Diffusion 3 采用了类似Sora的新架构Diffusion Transformer ，结合了新技术 Flow Matching ，大大提高了多主题提示、图像质量、拼写能力的性能。

这个模型在多主题提示、图像质量和拼写能力方面有了显着的性能提升，特别擅长处理包含多个主题的复杂提示，能够生成更加精细和逼真的图像。

非常大的变化是，提示词支持使用自然语言了。例如下面的示例：

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy.

提示词：史诗般的动漫艺术作品，一个巫师在夜晚的山顶上向黑暗的天空施放了一个宇宙咒语，上面写着“Stable Diffusion 3”，由五颜六色的能量组成。

Stable Diffusion 3生成图片示例

以下是官方发布的生成示例，确实在多主题提示、图像质量上有很大的提升。

Stable Diffusion 3适用人群

Stable Diffusion 3适用于需要快速、高效地从文本生成高质量图像的个人、开发者和企业。无论是艺术家寻求灵感、开发者构建应用程序，还是企业需要生成独特的视觉内容，Stable Diffusion 3都提供了一个强大的工具。

如何使用Stable Diffusion 3？

目前Stable Diffusion 3处于早期预览版，需要申请内测资格，点此申请加入候补名单。

申请通过后，官方会通过电子邮件通知并邀请你访问Stable Diffusion 3的 Discord 服务器体验。

了解更多信息，请前往官方博客：https://stability.ai/news/stable-diffusion-3

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

Stable Diffusion 3是什么？

Stable Diffusion 3生成图片示例

Stable Diffusion 3适用人群

如何使用Stable Diffusion 3？

相关文章