Google 文字转图像模型升级第二代，支援英文、中文等七种语言

AI与大数据 2小时前 0

▼

Google Cloud 打造第二代文字转图像 AI 工具 Imagen 2，其 AI 模型可以根据文字提示建立和编辑图像。

Imagen 2 利用 Google DeepMind 技术开发而成，该模型在 5 月 Google I/O 2023 开发者大会悄悄推出预览版，现在正式提供给列入许可名单的 Vertex AI 用户使用，Vertex AI 是用于建构模型和AI应用程式的开发者工具。与第一代 Imagen 相比，Google Cloud 声称 Imagen 2 在图像品质显着提升，并能准确描绘出提示需求。

Imagen 2 与其他图像生成模型如 OpenAI DALLE 3、Amazon Titan Image Generator 等大致相同，但有两点差异在于，Imagen 2 不仅可以读取英文提示，更直接支援中文、印地语、日语、韩语、葡萄牙语、西班牙语其他六种语言，明年也会支援更多语言，还能产生创意且逼真的标志并覆盖在现有图像上。

“由于新颖训练和建模技术，Imagen 2 可以理解更具描述性的长篇提示，并对有关图像细节提供详细答案”，Google Cloud 表示这些技术也强化 Imagen 2 多语言理解能力。

Imagen 2 利用 Google DeepMind 开发的 SynthID，将隐形浮水印加入模型产生的影像上，并能适应压缩、色彩调整、套用滤镜等图像编辑。侦测隐形浮水印需要 Google 的工具，第三方无法使用该工具。

Google Cloud 未透露使用哪些资料训练 Imagen 2 模型，这点不令人意外。像 Google 这种开发生成式 AI 的科技公司是否可以利用公开资料（甚至是受版权保护的资料）训练模型、从事商业活动，目前仍是一个悬而未决的法律问题。Google 则为用户提出赔偿办法，保护符合条件的 Vertex AI 用户免受与 Google 使用训练资料和 Imagen 2 输出的版权索赔。

Google debuts Imagen 2 with text and logo generation

（首图为 Imagen 2 生成范例，首图来源：Google DeepMind）

延伸阅读：

Google Brain 推出新的文字转图像模型 Imagen
Google Cloud 与 Google DeepMind 合作开发 AI 浮水印工具
输入文字自动产生图片，Google 生成式搜寻变身 AI 绘图神器

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

延伸阅读：

相关文章