Google 文字转图像模型升级第二代,支援英文、中文等七种语言

Google 文字转图像模型升级第二代,支援英文、中文等七种语言

Google Cloud 打造第二代文字转图像 AI 工具 Imagen 2,其 AI 模型可以根据文字提示建立和编辑图像。

Imagen 2 利用 Google DeepMind 技术开发而成,该模型在 5 月 Google I/O 2023 开发者大会悄悄推出预览版,现在正式提供给列入许可名单的 Vertex AI 用户使用,Vertex AI 是用于建构模型和AI应用程式的开发者工具。与第一代 Imagen 相比,Google Cloud 声称 Imagen 2 在图像品质显着提升,并能准确描绘出提示需求。

Imagen 2 与其他图像生成模型如 OpenAI DALLE 3、Amazon Titan Image Generator 等大致相同,但有两点差异在于,Imagen 2 不仅可以读取英文提示,更直接支援中文、印地语、日语、韩语、葡萄牙语、西班牙语其他六种语言,明年也会支援更多语言,还能产生创意且逼真的标志并覆盖在现有图像上。

“由于新颖训练和建模技术,Imagen 2 可以理解更具描述性的长篇提示,并对有关图像细节提供详细答案”,Google Cloud 表示这些技术也强化 Imagen 2 多语言理解能力。

Imagen 2 利用 Google DeepMind 开发的 SynthID,将隐形浮水印加入模型产生的影像上,并能适应压缩、色彩调整、套用滤镜等图像编辑。侦测隐形浮水印需要 Google 的工具,第三方无法使用该工具。

Google Cloud 未透露使用哪些资料训练 Imagen 2 模型,这点不令人意外。像 Google 这种开发生成式 AI 的科技公司是否可以利用公开资料(甚至是受版权保护的资料)训练模型、从事商业活动,目前仍是一个悬而未决的法律问题。Google 则为用户提出赔偿办法,保护符合条件的 Vertex AI 用户免受与 Google 使用训练资料和 Imagen 2 输出的版权索赔。

  • Google debuts Imagen 2 with text and logo generation

(首图为 Imagen 2 生成范例,首图来源:Google DeepMind

延伸阅读:

  • Google Brain 推出新的文字转图像模型 Imagen
  • Google Cloud 与 Google DeepMind 合作开发 AI 浮水印工具
  • 输入文字自动产生图片,Google 生成式搜寻变身 AI 绘图神器

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。