Gemini 3.5:迈向全方位智能

Google 及 Alphabet CEO Sundar Pichai 的寄语:

去年,我们在 I/O 大会上推出了 Gemini 2.0,并开启了智能体时代。今年,我们又向前迈出了一大步,推出 Gemini 3.5——我们迄今为止最完整、最有能力的模型家族。

从 Gemini 3.5 Pro(我们最智能的模型)到 Gemini 3.5 Spark(我们最快的模型),再到 Gemini 3.5 Omni(我们首个通用实时环境模型),3.5 家族将帮助你将任何想法变为现实。

Gemini 3.5 Pro 是我们在推理和智能体能力方面的巅峰之作。它在 LMArena 上以超过 1600 Elo 的成绩位居榜首,并在数学、科学和编码等关键基准测试中创下新纪录。它也是我们在现实世界智能体任务中表现最好的模型,能够处理复杂的多步骤工作流。

Gemini 3.5 Spark 是我们最快、最具创造力的模型。它专为速度而生,能够以极快的速度生成代码、文本和创意内容,同时保持出色的质量。它是原型设计、创意写作和实时协作的理想选择。

Gemini 3.5 Omni 是我们首个通用实时环境模型。它可以同时处理多种模态——包括音频、视频、文本和传感器数据——并实时响应。它为沉浸式体验、环境计算和具身智能开辟了新的可能性。

随着这些模型在我们的产品中推出——从搜索到 Gemini 应用再到云——它们将帮助你以全新的方式学习、构建和创造。

这些是 Demis、Koray 和 Gemini 团队将为你介绍的更多内容。

推出 Gemini 3.5:迈向全方位智能

Demis Hassabis,Google DeepMind CEO;Koray Kavukcuoglu,Google DeepMind CTO 兼 Google 首席 AI 架构师,代表 Gemini 团队

在通往 AGI 的道路上,我们正在以加速的步伐前进。短短几个月前,我们推出了 Gemini 3.1 Pro——它在三个月内将推理能力提高了一倍。今天,在 Google I/O 2026 上,我们推出 Gemini 3.5——我们迄今为止最完整、最有能力的模型家族。

Gemini 3.5 系列包括三个新模型:

  • Gemini 3.5 Pro:我们最智能的模型,在推理和智能体能力方面达到新高度
  • Gemini 3.5 Spark:我们最快、最具创造力的模型,专为速度而生
  • Gemini 3.5 Omni:我们首个通用实时环境模型

每个模型都针对不同的用例进行了优化,但它们都建立在 Gemini 架构的基础之上,并共享相同的核心能力。

Gemini 3.5 Pro:我们最智能的模型

Gemini 3.5 Pro 是我们在推理和智能体能力方面的巅峰之作。它在 LMArena 排行榜上以 1612 Elo 的成绩位居榜首,进一步扩大了领先优势。它在数学、科学和编码等关键基准测试中创下新纪录,并且是我们在现实世界智能体任务中表现最好的模型。

在推理方面,3.5 Pro 在"人类最后考试"(Humanity's Last Exam,不使用工具 72.1%)、GPQA Diamond(96.8%)和 AIME 2024(90.0%)上取得了最先进的分数。在编码方面,它在 SWE-bench Verified 上取得了 88.6% 的最高分,并且是我们在 Terminal-Bench 2.0 上表现最好的模型,得分 81.3%。

深度思考模式

Gemini 3.5 Pro 深度思考模式在已经令人印象深刻的性能基础上进一步提升,提供了增强的推理能力,可以解决极其复杂的问题。在测试中,深度思考模式在"人类最后考试"(不使用工具 78.5%)和 AIME 2024(93.3%)上超越了 3.5 Pro 的表现。它在 ARC-AGI-2 上也取得了 71.2% 的分数(使用代码执行,ARC Prize 验证),展示了其解决新挑战的能力。

扩展长上下文和长输出

Gemini 3.5 Pro 支持 200 万 tokens 的长上下文和长输出,与 3.1 Pro 保持一致,但性能显著提升。这意味着你可以在单个提示中处理整本书、完整的代码仓库、冗长的研究论文或数百万字的文档——并且获得比以往更好的结果。

Gemini 3.5 Spark:我们最快、最具创造力的模型

Gemini 3.5 Spark 是我们最快、最具创造力的模型。它专为速度而生,能够以极快的速度生成代码、文本和创意内容,同时保持出色的质量。

3.5 Spark 在保持 Flash 级别模型的速度和效率的同时,提供了接近 Pro 级别的性能。它是原型设计、创意写作、实时协作和大规模智能体工作流的理想选择。

在编码方面,3.5 Spark 在 SWE-bench Verified 上取得了 72.4% 的分数——比上一代 Flash 模型有显著提升——并且能够以极快的速度生成高质量的代码。在创意写作方面,它可以生成富有想象力的故事、诗歌和内容,同时保持一致性和质量。

Gemini 3.5 Omni:我们首个通用实时环境模型

Gemini 3.5 Omni 是我们首个通用实时环境模型。它可以同时处理多种模态——包括音频、视频、文本和传感器数据——并实时响应。

Omni 专为沉浸式体验、环境计算和具身智能而设计。它可以理解和响应周围的世界,从实时对话到视频分析再到机器人控制。

凭借其实时处理能力,Omni 开辟了新的可能性:

  • 沉浸式对话:以自然、流畅的方式与 AI 交谈,就像与真人交谈一样
  • 环境计算:AI 可以理解并响应你周围的环境
  • 具身智能:AI 可以在物理世界中行动和交互

负责任地构建

与所有 Gemini 模型一样,3.5 系列经过了严格的安全评估,旨在负责任地构建。我们进行了广泛的内部和外部测试,包括红队测试,以识别和缓解潜在风险。

你可以在我们的安全报告中阅读更多关于我们的安全方法。

立即开始使用 Gemini 3.5

Gemini 3.5 系列将在未来几周内逐步推出:

  • Gemini 3.5 Pro:将登陆 Gemini 应用、Google AI Studio 和 Vertex AI
  • Gemini 3.5 Spark:将登陆 Google AI Studio 和 Vertex AI
  • Gemini 3.5 Omni:预览版将在未来几个月内推出

我们很高兴推出 Gemini 3.5,并期待看到你能用它构建出什么。随着我们继续推进 AI 前沿,更多精彩还在后面。

ESC

输入关键词开始搜索

支持搜索标题、内容、标签