Google 及 Alphabet CEO Sundar Pichai 的寄语:
近四年前,我们开启了 Gemini 时代,这是我们公司有史以来规模最大的科学和产品事业之一。从那时起,看到人们如此喜爱它,真是令人难以置信。AI 概览(AI Overviews)现在每月有 20 亿用户使用。Gemini 应用每月超过 6.5 亿用户,我们 70% 以上的云客户使用我们的 AI,1300 万开发者使用我们的生成式模型进行构建——而这只是我们所看到的影响的冰山一角。
凭借我们在 AI 创新方面的差异化全栈方法——从领先的基础设施到世界一流的研究和模型与工具,再到触达全球数十亿人的产品——我们能够比以往任何时候都更快地将高级能力推向世界。
每一代 Gemini 都在前一代的基础上构建,让你能够做更多事情。Gemini 1 在原生多模态和长上下文窗口方面的突破,扩展了可以处理的信息种类——以及信息量。Gemini 2 为智能体能力奠定了基础,并推动了推理和思考的前沿,帮助处理更复杂的任务和想法,最终 Gemini 2.5 Pro 在 LMArena 上占据榜首超过六个月。
现在,我们推出 Gemini 3——我们最智能的模型,它融合了 Gemini 的所有能力,让你能够将任何想法变为现实。
它在推理方面达到了最先进水平,旨在把握深度和细微差别——无论是感知创意中的微妙线索,还是剖析难题的重叠层次。Gemini 3 也更善于理解你请求背后的上下文和意图,因此你只需更少的提示就能得到所需的结果。想想看,仅仅两年时间,AI 就从简单地阅读文本和图像,发展到了"读懂房间"的程度,这真是令人惊叹。
从今天开始,我们将以 Google 的规模推出 Gemini。这包括搜索中 AI 模式下的 Gemini 3,具备更复杂的推理和新的动态体验。这是我们首次在发布首日就将 Gemini 集成到搜索中。Gemini 3 今天也登陆 Gemini 应用,面向 AI Studio 和 Vertex AI 的开发者,以及我们全新的智能体开发平台 Google Antigravity——更多内容见下文。
与前几代一样,Gemini 3 再次推动了最先进的技术发展。在这个新篇章中,我们将继续推动智能、智能体和个性化的前沿,让 AI 真正为每个人所用。
我们希望你喜欢 Gemini 3,我们会不断改进它,并期待看到你用它构建出什么。更多精彩还在后面!
推出 Gemini 3:我们最智能的模型,助你将任何想法变为现实
Demis Hassabis,Google DeepMind CEO;Koray Kavukcuoglu,Google DeepMind CTO 兼 Google 首席 AI 架构师,代表 Gemini 团队
今天,我们在通往 AGI 的道路上又迈出了重要一步,发布 Gemini 3。
这是世界上多模态理解能力最强的模型,也是我们迄今为止最强大的智能体和氛围编码(vibe coding)模型,提供更丰富的可视化效果和更深的交互性——所有这些都建立在最先进推理的基础之上。
我们以发布预览版 Gemini 3 Pro 开启 Gemini 3 时代,并从今天起在一系列 Google 产品中提供,让你可以在日常生活中使用它来学习、构建和规划任何事情。我们还推出了 Gemini 3 深度思考(Gemini 3 Deep Think)——我们增强的推理模式,将 Gemini 3 的性能进一步推高——并在向 Google AI Ultra 订阅用户提供之前,先向安全测试人员开放访问权限。
最先进的推理,前所未有的深度与细微差别
Gemini 3 Pro 凭借其最先进的推理和多模态能力,可以将任何想法变为现实。它在每一个主要 AI 基准测试中都显著优于 2.5 Pro。
它以 1501 Elo 的突破性得分位居 LMArena 排行榜榜首。它展示了博士级别的推理能力,在"人类最后考试"(Humanity's Last Exam,不使用任何工具得分 37.5%)和 GPQA Diamond(91.9%)上获得最高分。它还在数学领域为前沿模型设定了新标准,在 MathArena Apex 上实现了 23.4% 的新纪录。
除了文本,Gemini 3 Pro 重新定义了多模态推理,在 MMMU-Pro 上得分 81%,在 Video-MMMU 上得分 87.6%。它在 SimpleQA Verified 上也取得了 72.1% 的最先进分数,显示出事实准确性方面的巨大进步。这意味着 Gemini 3 Pro 非常擅长以高度可靠性解决科学和数学等众多主题中的复杂问题。
Gemini 3 在一系列关键 AI 基准测试中达到最先进水平。详见我们的评估方法。
Gemini 3 Pro 还为每一次交互带来了新的深度和细微差别。它的回答智能、简洁、直接,用真正的洞见取代陈词滥调和奉承——告诉你你需要听到的,而不仅仅是你想听到的。它充当一个真正的思想伙伴,为你提供理解信息和表达自我的新方式,从通过生成高保真可视化代码来翻译艰深的科学概念,到创造性头脑风暴。
Gemini 3 可以编码托卡马克中等离子体流动的可视化,并写一首捕捉核聚变物理学的诗。
Gemini 3 深度思考
Gemini 3 深度思考模式将智能的边界推得更远,在 Gemini 3 的推理和多模态理解能力上实现了阶跃式提升,帮助你解决更复杂的问题。
在测试中,Gemini 3 深度思考在"人类最后考试"(不使用工具 41.0%)和 GPQA Diamond(93.8%)上超越了 Gemini 3 Pro 本已令人印象深刻的表现。它在 ARC-AGI-2 上实现了前所未有的 45.1%(使用代码执行,ARC Prize 验证),展示了其解决新挑战的能力。
Gemini 3 深度思考模式在一些最具挑战性的 AI 基准测试中表现出色。详见我们的评估方法。
Gemini 3 帮助你学习、构建和规划任何事情
学习任何事情
Gemini 从一开始就被设计为可以无缝综合关于任何主题的信息,跨文本、图像、视频、音频和代码等多种模态。Gemini 3 通过其最先进的推理、视觉和空间理解、领先的多语言性能以及 100 万 token 上下文窗口,将多模态推理的前沿推向新高度,帮助你以适合自己的方式学习。
例如,如果你想学习如何按照家族传统烹饪,Gemini 3 可以破译并翻译不同语言的手写食谱,转换成可共享的家庭食谱。或者,如果你想了解一个新主题,你可以给它学术论文、长视频讲座或教程,它可以生成交互式抽认卡、可视化效果或其他格式的代码,帮助你掌握材料。它甚至可以分析你的匹克球比赛视频,找出你可以改进的地方,并生成整体动作改进的训练计划。
Gemini 3 可以帮助你学习和保存家族烹饪传统。在 Gemini Canvas 中试用。
Gemini 3 可以帮助你分析复杂信息,比如研究论文,并可以生成交互式指南的代码。
获得专家级运动分析,分析你的匹克球比赛,帮助改进你的技术。
为了帮助你更好地理解网络上的信息,搜索中的 AI 模式现在使用 Gemini 3,实现新的生成式 UI 体验,如沉浸式视觉布局以及交互式工具和模拟——所有这些都基于你的查询即时生成。
学习复杂主题,比如 RNA 聚合酶如何通过搜索中 AI 模式的生成式 UI 工作。
构建任何事情
在 2.5 Pro 成功的基础上,Gemini 3 兑现了为开发者带来任何想法的承诺。它在零样本生成方面表现卓越,能够处理复杂的提示和指令,渲染更丰富、更具交互性的 Web UI。
Gemini 3 是我们迄今为止构建的最好的氛围编码和智能体编码模型——使我们的产品更加自主,并提高开发者的生产力。它以 1487 Elo 的令人印象深刻得分位居 WebDev Arena 排行榜榜首。它在 Terminal-Bench 2.0 上也获得了 54.2% 的分数,该基准测试模型通过终端操作计算机的工具使用能力,并且在 SWE-bench Verified(衡量编码智能体的基准测试)上大大优于 2.5 Pro,得分达到 76.2%。
你现在可以在 Google AI Studio、Vertex AI、Gemini CLI 和我们新的智能体开发平台 Google Antigravity 中使用 Gemini 3 进行构建。它也可在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台中使用。
编码复古 3D 太空飞船游戏,拥有更丰富的可视化效果和改进的交互性。在 AI Studio 中试用。
通过构建、解构和混合详细的 3D 体素艺术,让你的想象力变为现实。在 AI Studio 中试用。
使用 Gemini 3 构建可玩的科幻世界并使用着色器。在 AI Studio 中试用。
你可以使用 Gemini 3 进行氛围编码,创建更丰富、更具交互性的 Web UI 和应用。
推出全新的智能体优先开发体验
随着模型智能随着 Gemini 3 的加速,我们有机会重新构想整个开发者体验。今天,我们发布 Google Antigravity——我们全新的智能体开发平台,使开发者能够在更高的、面向任务的层面上操作。
利用 Gemini 3 的高级推理、工具使用和智能体编码能力,Google Antigravity 将 AI 协助从开发者工具包中的一个工具转变为主动的合作伙伴。虽然 Google Antigravity 的核心是熟悉的 AI IDE 体验,但其智能体已被提升到专用界面,并获得了对编辑器、终端和浏览器的直接访问。现在,智能体可以自主规划并同时代表你执行复杂的端到端软件任务,同时验证自己的代码。
除了 Gemini 3 Pro,Google Antigravity 还与我们最新的 Gemini 2.5 计算机使用模型(用于浏览器控制)以及我们评分最高的图像编辑模型 Nano Banana(Gemini 2.5 Image)紧密结合。
Google Antigravity 使用 Gemini 3 驱动飞行跟踪器应用的端到端智能体工作流。智能体独立规划、编码应用程序,并通过基于浏览器的计算机使用验证其执行。
规划任何事情
自从我们用 Gemini 2 引入智能体时代以来,我们取得了很大进展,不仅推进了 Gemini 的编码智能体能力,还提高了其在更长时间范围内可靠提前规划的能力。Gemini 3 通过在 Vending-Bench 2 上位居榜首证明了这一点,该基准通过管理模拟自动售货机业务来测试更长时间范围的规划。Gemini 3 Pro 在整整一年的模拟运营中保持一致的工具使用和决策,在不偏离任务的情况下推动更高的回报。
Gemini 3 Pro 展示了更好的长时间范围规划能力,与其他前沿模型相比,产生了显著更高的回报。
这意味着 Gemini 3 可以更好地帮助你在日常生活中完成任务。通过将更深的推理与改进的、更一致的工具使用相结合,Gemini 3 可以通过导航更复杂的多步骤工作流(从开始到完成)代表你采取行动——比如预订本地服务或整理你的收件箱——所有这些都在你的控制和指导之下。
Google AI Ultra 订阅用户今天就可以在 Gemini 应用中通过 Gemini Agent 试用这些智能体功能。我们在改进 Gemini 智能体功能方面学到了很多,我们很高兴看到你如何使用它,因为我们很快将扩展到更多 Google 产品。
Gemini Agent 可以帮助你整理 Gmail 收件箱。立即在 Gemini 应用中为 Google AI Ultra 订阅用户试用。
负责任地构建 Gemini 3
Gemini 3 是我们迄今为止最安全的模型,并且经过了所有 Google AI 模型中最全面的安全评估。该模型显示出减少的谄媚行为、更强的抗提示注入能力,以及更好的网络攻击滥用防护。
除了我们在前沿安全框架关键领域的内部测试外,我们还与世界领先的主题专家合作进行评估,包括网络安全专家、生物学家、风险研究人员和教育工作者。我们还继续我们的红队合作,并进行外部红队测试,以发现我们可能遗漏的风险。
我们还在整个模型开发过程中进行严格的测试,从预训练数据中的安全缓解措施,到后训练中的安全微调和强化学习,再到发布前的广泛评估。我们致力于以负责任的方式推进 AI,并相信我们有责任以深思熟虑、细致入微的方式构建和部署这些强大的系统。
你可以在我们的安全报告中阅读更多关于我们的安全方法。
接下来是什么
今天,我们才刚刚开始 Gemini 3 能做什么。随着我们不断改进模型,你可以期待更多的能力和更多的方式来使用 Gemini 帮助你学习、构建和规划。
我们很高兴推出 Gemini 3,并期待看到你能用它做什么。今天就开始使用吧:
- 在搜索中使用 AI 模式
- 在 Gemini 应用中试用 Gemini 3
- 在 Google AI Studio 中开始构建
- 在 Vertex AI 中构建企业级应用
- 尝试我们全新的智能体开发平台 Google Antigravity