挑战 OpenAI 关键利器终现身!Google 发表 Gemini 模型,Bard、Pixel 8 Pro 率先导入

挑战 OpenAI 关键利器终现身!Google 发表 Gemini 模型,Bard、Pixel 8 Pro 率先导入

近 10 年来,Google 宣称一直是 AI 优先的公司。当 ChatGPT 开启 AI 时代经过一年后,Google 借由全新 Gemini 模型大步向前,期望能超越 OpenAI 及其 GPT-4 模型。

Google I/O 2023 开发者大会即预告的 Gemini 模型,并未等到 2024 年第一季才现身,6 日由 Google 执行长皮蔡(Sundar Pichai)和 Google DeepMind 执行长哈萨比斯(Demis Hassabis)向世人介绍 Google 目前最强大、最通用的模型,第一版 Gemini 1.0 能够理解和操作包括文字、图像、音讯、视讯、程式码在内不同类型资讯。

Gemini 原生设计成多模态模型,一开始就在不同模态上预训练,接着透过额外的多模态资料进行微调、提升效能。Gemini 1.0 所受的训练是同时辨识和理解文字、图像、音讯等不同资讯,并回答涉及复杂主题的问题,这也让 Gemini 在解释、推理如数学和物理这样复杂的问题时表现出色。

不只如此,Gemini 1.0 能够理解和解释世界上常用的程式语言如 Python、Java、C++ 和 Go,并且产生高品质的程式码。值得一提的是,Google DeepMind 2 年前推出 AI 程式码生成系统 AlphaCode,现在透过一个专门版本的 Gemini,建立更进阶的 AlphaCode 2,不仅擅长程式设计,还能处理与数学、理论电脑科学相关的竞技程式设计问题。

Google DeepMind 团队使用 Google 自行研发、用于加速机器学习的 TPU(Tensor Processing Unit)v4 和 v5e,有规模地训练 Gemini 1.0。依照模型大小有 Ultra、Pro、Nano 三种,其中 Gemini Ultra 为规模最大、功能最强大的模型,专为高度复杂任务所设计,Gemini Nano 则是处理装置上任务最有效率的模型。

挑战 OpenAI 关键利器终现身!Google 发表 Gemini 模型,Bard、Pixel 8 Pro 率先导入 AI与大数据 图2张

▲ 随着 Gemini 问世,Google 也公开全新TPU v5p,帮助加速 Gemini 发展。

Google DeepMind 团队不断对 Gemini 模型进行严格测试,从理解自然图像、音讯、视讯再到数学推理,其中发现 Gemini Ultra 在大型语言模型研究和开发广泛采用的 32 项学术基准测试中,有 30 个取得领先成绩。其中 Gemini Ultra 以 90% 的高得分成为第一个在 MMLU(massive multitask language understanding,大规模多任务语言理解)测试里超越人类专家的模型,而在新的 MMMU 基准测试里也得到 59.4% 领先分数,两项测试皆超越 OpenAI 所开发的 GPT-4 模型。

挑战 OpenAI 关键利器终现身!Google 发表 Gemini 模型,Bard、Pixel 8 Pro 率先导入 AI与大数据 图3张

▲ Gemini Ultra 在 MMLU 测试获得90% 高分,超越 GPT-4。

截至目前 Google 所有 AI 模型中,Gemini 在偏误、资料毒性(toxicity)等方面都接受最全面的安全性评估。在网络攻击、说服能力、自主性等可能存在风险的领域,Google DeepMind 团队都进行最新研究,也运用 Google Research 的对抗测试技巧,在部署 Gemini 前率先找出关键的安全问题。

Google 将在多项产品中导入 Gemini,包括软件方面的 Bard、以及有关硬件的 Pixel 8 Pro。从 12 月 13 日起,开发者和企业客户可以透过 Google AI Studio 或 Google Cloud Vertex AI 的 Gemini API 使用 Gemini Pro。Android 开发者也能透过 AICore,在开发作业中运用 Gemini Nano。

▲ Google 测试让多模态的 Gemini 看一系列影像,并推理出所看到的内容。

ChatGPT 推出后 Google 内部发出“红色警戒”(code red),那时起被认为在 AI 竞赛急起直追。Gemini 可说是 Google 多年来一直苦心建立的模型,也被外界视为能一举挑战 OpenAI 的关键利器,我们将在越来越多 Google 产品看见 Gemini 身影,及其驱动的强大功能。

(图片来源:Google Blog)

延伸阅读:

  • Bard 两阶段导入 Gemini,Gemini Pro 模型即日起支援 Bard 英文版
  • Pixel 8 Pro 升级内建 Gemini 模型,增添两个 AI 新功能、离线也能用

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。