Stability AI 发表 Stable Diffusion 3 预览,提高文字生成图像品质
▼
AI 新创 Stability AI 以图像生成软件 Stable Diffusion 闻名,22 日发表下一代 Stable Diffusion 3 预览,承袭 Stable Diffusion 系列优点,能够产生更多主题的图像,并提高文字生成的品质和准确性。Stability AI 虽未公开展示操作,但已开放想尝试的用户加入等候名单。
Stable Diffusion 3 参数从 8 亿到 80 亿不等,适合在各种装置上(从智慧手机、AI PC 到服务器)执行,参数大小与这款模型可以产生多少图像细节的能力有关,较大模型需要 GPU 加速器有更多 VRAM 才能运作。
“这是使用新型的 diffusion transformer(类似于 Sora),并结合 flow matching 和其他改进”,Stability AI 执行长 Emad Mostaque 透过个人 X 帐号表示。由于利用 transformer 改进,不仅可以进一步扩展并且接受多模态输入。
自 2022 年以来,可以看到 Stability AI 推出了一系列图像生成模型:Stable Diffusion 1.4、1.5、2.0、2.1、XL、XL Turbo,直到现在 Stable Diffusion 3。Stability AI 提供更开放的方案,再到像是 OpenAI DALLE 3这样的图像生成模型,尽管用到受版权保护的训练资料、具有偏见和滥用的可能性而引发争议。Stable Diffusion 的模型开放权重且来源可用,这意味着模型可在本地端执行并进行微调,使输出更符合需求。
虽然 Stable Diffusion 3 还未能广泛开放,但 Stability AI 表示,一旦测试完成将能免费下载并在本地端执行。“与之前模型一样,这个预览会收集意见,在公开发表之前提高性能和安全性”,Stability AI 强调。
- Stability announces Stable Diffusion 3, a next-gen AI image generator
(首图来源:Stability AI)
延伸阅读:
- Stability AI 发表 1.6B 轻量新模型,测试表现胜过微软 Phi-2
- Stable Video Diffusion 发表,可用图片产生影片
- 开源版 ChatGPT 要来了?AI 做图神器团队想让每个人都能做出大模型
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。