Gemini 示范影片造假？Google DeepMind 澄清：影片都是真的

AI与大数据 16分钟前 0

▼

Google 释出一段“Hands-on with Gemini”影片，测试让多模态的 Gemini 看一系列影像，推理出所看到的内容，同时与测试人员互动。但这段与 Gemini 流畅互动的影片引起部分人士质疑真实性，对此 Google DeepMind 出面说明。

Gemini 原生设计成多模态模型，第一版 Gemini 1.0 所受的训练能够同时辨识和理解文字、图像、音讯等不同资讯，并回答涉及复杂主题的问题。为让大众了解 Gemini 强大之处，Google 释出影片测试让 Gemini 看一系列影像，不仅推理出看到的内容，同时也与测试人员紧密互动。这段令人惊叹的影片已超过 150 万观看次数，带出人们能与应用 Gemini 的服务产生接近真人般互动，也凸显多模态模型如何灵活适应各种资讯输入、即时产生回馈。

尽管 Google 在影片资讯栏说明“为使示范影片简洁，延迟部分已减少，Gemini 输出也已缩短”，但 Gemini 回答之快，几乎没有犹豫，也没有冗长答案，行云流水般的影像不免怀疑是否经过 Google 精心安排才呈现出理想成果，夸大了 Gemini 性能，人们是否被 Gemini 互动速度、准确性所误导。

▲ 引起讨论的“Hands-on with Gemini”影片

对此，Google DeepMind 研究和深度学习负责人 Oriol Vinyals 表示，示范影片为 Gemini 提供一连串不同模态如图像、文字等资讯，让它透过预测接下来可能发生的情况来回应。在打造应用程式时，可对 Gemini 下提示指令，让用户行为与模型相配置，就能获得类似结果。

Oriol Vinyals 发文强调，所有 Gemini 提示和输出都是真的，为影片简洁起见而缩短长度，开发者部落格也有专文说明这段影片如何透过多模态提示与 Gemini 互动。未来 Gemini Pro 开放使用时，开发者可以尝试类似操作，也希望借此影片激励开发者创造更多可能性。

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0

We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP

— Oriol Vinyals (@OriolVinyalsML) December 7, 2023

▲ Google DeepMind 副总出面澄清示范影片造假疑虑。

Google’s best Gemini demo was faked

（首图来源：影片截图）

延伸阅读：

Google 史上最强模型 Gemini，真的全面辗压 GPT-4 吗？
挑战 OpenAI 关键利器终现身！Google 发表 Gemini 模型，Bard、Pixel 8 Pro 率先导入
Bard 两阶段导入 Gemini，Gemini Pro 模型即日起支援 Bard 英文版
Google 打造新一代 TPU v5p 和 AI 超级电脑，加速 Gemini 模型发展

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

延伸阅读：

相关文章