Gemini 3 开启智能新纪元 - Gemini

Google 及 Alphabet CEO Sundar Pichai 的寄语：

近四年前，我们开启了 Gemini 时代，这是我们公司有史以来规模最大的科学和产品事业之一。从那时起，看到人们如此喜爱它，真是令人难以置信。AI 概览（AI Overviews）现在每月有 20 亿用户使用。Gemini 应用每月超过 6.5 亿用户，我们 70% 以上的云客户使用我们的 AI，1300 万开发者使用我们的生成式模型进行构建——而这只是我们所看到的影响的冰山一角。

凭借我们在 AI 创新方面的差异化全栈方法——从领先的基础设施到世界一流的研究和模型与工具，再到触达全球数十亿人的产品——我们能够比以往任何时候都更快地将高级能力推向世界。

每一代 Gemini 都在前一代的基础上构建，让你能够做更多事情。Gemini 1 在原生多模态和长上下文窗口方面的突破，扩展了可以处理的信息种类——以及信息量。Gemini 2 为智能体能力奠定了基础，并推动了推理和思考的前沿，帮助处理更复杂的任务和想法，最终 Gemini 2.5 Pro 在 LMArena 上占据榜首超过六个月。

现在，我们推出 Gemini 3——我们最智能的模型，它融合了 Gemini 的所有能力，让你能够将任何想法变为现实。

它在推理方面达到了最先进水平，旨在把握深度和细微差别——无论是感知创意中的微妙线索，还是剖析难题的重叠层次。Gemini 3 也更善于理解你请求背后的上下文和意图，因此你只需更少的提示就能得到所需的结果。想想看，仅仅两年时间，AI 就从简单地阅读文本和图像，发展到了"读懂房间"的程度，这真是令人惊叹。

从今天开始，我们将以 Google 的规模推出 Gemini。这包括搜索中 AI 模式下的 Gemini 3，具备更复杂的推理和新的动态体验。这是我们首次在发布首日就将 Gemini 集成到搜索中。Gemini 3 今天也登陆 Gemini 应用，面向 AI Studio 和 Vertex AI 的开发者，以及我们全新的智能体开发平台 Google Antigravity——更多内容见下文。

与前几代一样，Gemini 3 再次推动了最先进的技术发展。在这个新篇章中，我们将继续推动智能、智能体和个性化的前沿，让 AI 真正为每个人所用。

我们希望你喜欢 Gemini 3，我们会不断改进它，并期待看到你用它构建出什么。更多精彩还在后面！

推出 Gemini 3：我们最智能的模型，助你将任何想法变为现实

Demis Hassabis，Google DeepMind CEO；Koray Kavukcuoglu，Google DeepMind CTO 兼 Google 首席 AI 架构师，代表 Gemini 团队

今天，我们在通往 AGI 的道路上又迈出了重要一步，发布 Gemini 3。

这是世界上多模态理解能力最强的模型，也是我们迄今为止最强大的智能体和氛围编码（vibe coding）模型，提供更丰富的可视化效果和更深的交互性——所有这些都建立在最先进推理的基础之上。

我们以发布预览版 Gemini 3 Pro 开启 Gemini 3 时代，并从今天起在一系列 Google 产品中提供，让你可以在日常生活中使用它来学习、构建和规划任何事情。我们还推出了 Gemini 3 深度思考（Gemini 3 Deep Think）——我们增强的推理模式，将 Gemini 3 的性能进一步推高——并在向 Google AI Ultra 订阅用户提供之前，先向安全测试人员开放访问权限。

最先进的推理，前所未有的深度与细微差别

Gemini 3 Pro 凭借其最先进的推理和多模态能力，可以将任何想法变为现实。它在每一个主要 AI 基准测试中都显著优于 2.5 Pro。

它以 1501 Elo 的突破性得分位居 LMArena 排行榜榜首。它展示了博士级别的推理能力，在"人类最后考试"（Humanity's Last Exam，不使用任何工具得分 37.5%）和 GPQA Diamond（91.9%）上获得最高分。它还在数学领域为前沿模型设定了新标准，在 MathArena Apex 上实现了 23.4% 的新纪录。

除了文本，Gemini 3 Pro 重新定义了多模态推理，在 MMMU-Pro 上得分 81%，在 Video-MMMU 上得分 87.6%。它在 SimpleQA Verified 上也取得了 72.1% 的最先进分数，显示出事实准确性方面的巨大进步。这意味着 Gemini 3 Pro 非常擅长以高度可靠性解决科学和数学等众多主题中的复杂问题。

Gemini 3 在一系列关键 AI 基准测试中达到最先进水平。详见我们的评估方法。

Gemini 3 Pro 还为每一次交互带来了新的深度和细微差别。它的回答智能、简洁、直接，用真正的洞见取代陈词滥调和奉承——告诉你你需要听到的，而不仅仅是你想听到的。它充当一个真正的思想伙伴，为你提供理解信息和表达自我的新方式，从通过生成高保真可视化代码来翻译艰深的科学概念，到创造性头脑风暴。

Gemini 3 可以编码托卡马克中等离子体流动的可视化，并写一首捕捉核聚变物理学的诗。

Gemini 3 深度思考

Gemini 3 深度思考模式将智能的边界推得更远，在 Gemini 3 的推理和多模态理解能力上实现了阶跃式提升，帮助你解决更复杂的问题。

在测试中，Gemini 3 深度思考在"人类最后考试"（不使用工具 41.0%）和 GPQA Diamond（93.8%）上超越了 Gemini 3 Pro 本已令人印象深刻的表现。它在 ARC-AGI-2 上实现了前所未有的 45.1%（使用代码执行，ARC Prize 验证），展示了其解决新挑战的能力。

Gemini 3 深度思考模式在一些最具挑战性的 AI 基准测试中表现出色。详见我们的评估方法。

Gemini 3 帮助你学习、构建和规划任何事情

学习任何事情

Gemini 从一开始就被设计为可以无缝综合关于任何主题的信息，跨文本、图像、视频、音频和代码等多种模态。Gemini 3 通过其最先进的推理、视觉和空间理解、领先的多语言性能以及 100 万 token 上下文窗口，将多模态推理的前沿推向新高度，帮助你以适合自己的方式学习。

例如，如果你想学习如何按照家族传统烹饪，Gemini 3 可以破译并翻译不同语言的手写食谱，转换成可共享的家庭食谱。或者，如果你想了解一个新主题，你可以给它学术论文、长视频讲座或教程，它可以生成交互式抽认卡、可视化效果或其他格式的代码，帮助你掌握材料。它甚至可以分析你的匹克球比赛视频，找出你可以改进的地方，并生成整体动作改进的训练计划。

Gemini 3 可以帮助你学习和保存家族烹饪传统。在 Gemini Canvas 中试用。

Gemini 3 可以帮助你分析复杂信息，比如研究论文，并可以生成交互式指南的代码。

获得专家级运动分析，分析你的匹克球比赛，帮助改进你的技术。

为了帮助你更好地理解网络上的信息，搜索中的 AI 模式现在使用 Gemini 3，实现新的生成式 UI 体验，如沉浸式视觉布局以及交互式工具和模拟——所有这些都基于你的查询即时生成。

学习复杂主题，比如 RNA 聚合酶如何通过搜索中 AI 模式的生成式 UI 工作。

构建任何事情

在 2.5 Pro 成功的基础上，Gemini 3 兑现了为开发者带来任何想法的承诺。它在零样本生成方面表现卓越，能够处理复杂的提示和指令，渲染更丰富、更具交互性的 Web UI。

Gemini 3 是我们迄今为止构建的最好的氛围编码和智能体编码模型——使我们的产品更加自主，并提高开发者的生产力。它以 1487 Elo 的令人印象深刻得分位居 WebDev Arena 排行榜榜首。它在 Terminal-Bench 2.0 上也获得了 54.2% 的分数，该基准测试模型通过终端操作计算机的工具使用能力，并且在 SWE-bench Verified（衡量编码智能体的基准测试）上大大优于 2.5 Pro，得分达到 76.2%。

你现在可以在 Google AI Studio、Vertex AI、Gemini CLI 和我们新的智能体开发平台 Google Antigravity 中使用 Gemini 3 进行构建。它也可在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台中使用。

编码复古 3D 太空飞船游戏，拥有更丰富的可视化效果和改进的交互性。在 AI Studio 中试用。

通过构建、解构和混合详细的 3D 体素艺术，让你的想象力变为现实。在 AI Studio 中试用。

使用 Gemini 3 构建可玩的科幻世界并使用着色器。在 AI Studio 中试用。

你可以使用 Gemini 3 进行氛围编码，创建更丰富、更具交互性的 Web UI 和应用。

推出全新的智能体优先开发体验

随着模型智能随着 Gemini 3 的加速，我们有机会重新构想整个开发者体验。今天，我们发布 Google Antigravity——我们全新的智能体开发平台，使开发者能够在更高的、面向任务的层面上操作。

利用 Gemini 3 的高级推理、工具使用和智能体编码能力，Google Antigravity 将 AI 协助从开发者工具包中的一个工具转变为主动的合作伙伴。虽然 Google Antigravity 的核心是熟悉的 AI IDE 体验，但其智能体已被提升到专用界面，并获得了对编辑器、终端和浏览器的直接访问。现在，智能体可以自主规划并同时代表你执行复杂的端到端软件任务，同时验证自己的代码。

除了 Gemini 3 Pro，Google Antigravity 还与我们最新的 Gemini 2.5 计算机使用模型（用于浏览器控制）以及我们评分最高的图像编辑模型 Nano Banana（Gemini 2.5 Image）紧密结合。

Google Antigravity 使用 Gemini 3 驱动飞行跟踪器应用的端到端智能体工作流。智能体独立规划、编码应用程序，并通过基于浏览器的计算机使用验证其执行。

规划任何事情

自从我们用 Gemini 2 引入智能体时代以来，我们取得了很大进展，不仅推进了 Gemini 的编码智能体能力，还提高了其在更长时间范围内可靠提前规划的能力。Gemini 3 通过在 Vending-Bench 2 上位居榜首证明了这一点，该基准通过管理模拟自动售货机业务来测试更长时间范围的规划。Gemini 3 Pro 在整整一年的模拟运营中保持一致的工具使用和决策，在不偏离任务的情况下推动更高的回报。

Gemini 3 Pro 展示了更好的长时间范围规划能力，与其他前沿模型相比，产生了显著更高的回报。

这意味着 Gemini 3 可以更好地帮助你在日常生活中完成任务。通过将更深的推理与改进的、更一致的工具使用相结合，Gemini 3 可以通过导航更复杂的多步骤工作流（从开始到完成）代表你采取行动——比如预订本地服务或整理你的收件箱——所有这些都在你的控制和指导之下。

Google AI Ultra 订阅用户今天就可以在 Gemini 应用中通过 Gemini Agent 试用这些智能体功能。我们在改进 Gemini 智能体功能方面学到了很多，我们很高兴看到你如何使用它，因为我们很快将扩展到更多 Google 产品。

Gemini Agent 可以帮助你整理 Gmail 收件箱。立即在 Gemini 应用中为 Google AI Ultra 订阅用户试用。

负责任地构建 Gemini 3

Gemini 3 是我们迄今为止最安全的模型，并且经过了所有 Google AI 模型中最全面的安全评估。该模型显示出减少的谄媚行为、更强的抗提示注入能力，以及更好的网络攻击滥用防护。

除了我们在前沿安全框架关键领域的内部测试外，我们还与世界领先的主题专家合作进行评估，包括网络安全专家、生物学家、风险研究人员和教育工作者。我们还继续我们的红队合作，并进行外部红队测试，以发现我们可能遗漏的风险。

我们还在整个模型开发过程中进行严格的测试，从预训练数据中的安全缓解措施，到后训练中的安全微调和强化学习，再到发布前的广泛评估。我们致力于以负责任的方式推进 AI，并相信我们有责任以深思熟虑、细致入微的方式构建和部署这些强大的系统。

你可以在我们的安全报告中阅读更多关于我们的安全方法。

接下来是什么

今天，我们才刚刚开始 Gemini 3 能做什么。随着我们不断改进模型，你可以期待更多的能力和更多的方式来使用 Gemini 帮助你学习、构建和规划。

我们很高兴推出 Gemini 3，并期待看到你能用它做什么。今天就开始使用吧：

在搜索中使用 AI 模式
在 Gemini 应用中试用 Gemini 3
在 Google AI Studio 中开始构建
在 Vertex AI 中构建企业级应用
尝试我们全新的智能体开发平台 Google Antigravity