PixArt-华为发布的AI图像生成模型，支持生成4K图像

AI大模型 6天前 0

▼

目录

Toggle

PixArt是什么？

PIXART- 是一个由华为诺亚方舟实验室、大连理工大学和香港大学的研究团队开发的扩散变换器模型（DiT），专门用于4K分辨率的文本到图像生成。这个模型在前身 PixArt- 的基础上进行了显着的改进，提供了更高保真度的图像和更好的文本提示对齐。

项目地址：https://pixart-alpha.github.io/PixArt-sigma-project/

PixArt

PixArt的主要特性

PIXART- 的关键特点包括：

高质量训练数据：PIXART- 整合了更高质量的图像数据，并与更精确、详细的图像标题配对。
高效的令牌压缩：提出了一种新的注意力模块，用于在 DiT 框架内压缩键和值，显着提高了效率，并促进了超高分辨率图像的生成。
较小的模型大小：PIXART- 拥有0.6B参数，比现有的文本到图像扩散模型（如SDXL的2.6B参数和SD Cascade的5.1B参数）更小，但仍然能够实现卓越的图像质量和用户提示的遵循能力。
4K图像生成能力：支持创建高分辨率的海报和壁纸，有效地支持电影和游戏等行业高质量视觉内容的生产。

PIXART- 的这些进步使其成为一个强大的工具，适用于需要高质量视觉内容生成的应用场景。研究团队还提供了相关的代码和演示，以便其他研究人员和开发者可以进一步探索和利用这个模型。

如何使用PixArt？

项目地址（含体验地址）：https://pixart-alpha.github.io/PixArt-sigma-project/
论文地址：https://arxiv.org/abs/2403.04692
GitHub：https://github.com/PixArt-alpha/PixArt-sigma

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

PixArt 图像生成