Gemini 3深夜到来:压倒GPT 5.1,伟大的Google模式时代已经到来

《机器之心》报道称,《机器之心》社论 Gemini 3 尚未出现,Twitter 率先崩溃。没有比 Gemini 3 的发布更令人期待的了。从过去三个月 Gemini 的更新频率来看,AI 社区自 9 月份以来就对 Gemini 3 翘首以盼。今天,谷歌开发者关系主管兼谷歌AI工作室负责人发布了一条推文,其中仅包含“Gemini”一词。数月的期待终于达到了临界点,推特上的相关话题瞬间沸腾。有趣的是,随着发布日期的临近,Twitter“因应情况”多次崩溃。 “幕后罪魁祸首”是 Cloudflare,但这次崩溃的时间是如此精确,以至于人们怀疑是否有其他人在幕后黑手(安静的板球:毕竟,Twitter 是各种模型的主要推广中心)。目前还不清楚马斯克现在在想什么,因为他今天早上刚刚发布了 Grok 4.1。不管怎样,网友们已经被表情包淹没了。此前,Gemini 3终于正式亮相。让我们看看他在聚光灯下的实力有多强。事实证明,谷歌最聪明的模型并没有让那些等待的人失望。 Gemini 3正式发布,重新定义SOTA。奥特曼和马斯克也发来贺电。谷歌将其定义为“迈向AGI的重要一步”,强调它是世界上最深入的交互和多模态理解智能代理。除了更新基本推理能力的SOTA标准外,Gemini 3还尝试通过推出全新的Google Antigravity平台和Deep Think模式来重塑开发者生态和AI辅助体验。称霸榜单的推理怪兽Gemini 3 Pro,官方被称为“推理模型下一代AI”。几乎所有的 lord 在当前的 AI 基准测试中均显着优于上一代 Gemini 2.5 Pro,并远超关键竞争对手或如 Claude Sonnet 4.5 和 GPT-5.1。 Gemini 3 Pro 以 1501 的历史 Elo 分数荣登 LMArena 排行榜榜首,在 Humanity’s Last Exam(无工具情况下 37.5%)和 GPQA Diamond(91.9%)中取得最高分,展现了博士级别的推理能力。我们还在 MathArena Apex 中实现了 23.4% 的最先进 SOTA,为最先进的数学模型设立了新标准。除了文本和逻辑之外,Gemini 3 Pro还重新定义了多模态推理的极限。它在MMMU-Pro和Video-MMMU中分别获得了81%和87.6%的高分。更引人注目的是,在 SimpleQA Verified 上得分为 72.1%,这显着提高了其客观准确性。它不仅功能强大,而且可靠。作为一款不讨人喜欢的思想伴侣,Gemini 3 Pro 的进步不仅在于它的运行分数,还在于它的交互质量。摆脱过去人工智能常见的陈词滥调和夸张的陈词滥调,告诉它们智能简洁、直接,不仅是你想听的,也是你需要听的。它是一个真正的思考伙伴,提供理解信息和表达自己的新方法,从翻译晦涩的科学概念到生成高保真可视化代码的创造性头脑风暴。 Gemini 3 编写了代码来可视化托卡马克内部的等离子体流,创作了一首捕捉聚变物理原理的诗。 Gemini 3 Deep Think Gemini 3 Deep Think 模式进一步突破了信息智能的界限,显着提升了 Gemini 3 的多模式理解和推理能力,帮助您解决更复杂的问题。在测试中,GemiEl ni 3 Deep Think 在 Humanity’s Last Exam(无工具情况下得分 41.0%)和 GPQA Diamond(得分 93.8%)两方面都超越了 Gemini 3 Pro 本来就很优秀的成绩。此外,它在 ARC-AGI-2(代码执行,ARC 奖验证)中取得了前所未有的 45.1% 的分数,展示了其解决全新挑战的能力。 Gemini 3 的 Deep Think 模式在一些最严格的 AI 基准测试中表现出色。学习、创建、计划学习任何内容 Gemini 的设计初衷是无缝集成任何主题的多种方式的信息,包括文本、图像、视频、音频和代码。 Gemini 3 结合了先进的推理能力、视觉和空间理解、尖端的多语言性能以及百万级令牌上下文 ntana,进一步突破多模态推理的界限,让您以最适合您的方式进行学习。例如,如果您想学习如何准备传统的家常饭菜,Gemini 3可以解释和翻译不同语言的手写食谱,并生成您可以与家人分享的食谱。或者,如果您想学习新主题,我们提供的教程可以生成学术文章、长视频讲座或交互式抽认卡、可视化或其他形式的代码来帮助您你获得知识。您还可以分析匹克球比赛的视频,以确定需要改进的领域,并制定训练计划来帮助您提高整体比赛水平。搜索 AI 模型现在使用 Gemini 3 来实现新功能,帮助您更好地理解网络信息。生成式 UI 体验(如沉浸式视觉设计、交互式工具和模拟)是根据查询动态生成的。了解复杂的主题,例如 RNA 聚合酶如何在 AI 模式生成 UI 中工作。以一切为基础 在 2.5 Pro 的成功基础上,Gemini 3 兑现了让每个开发人员的想法成为现实的承诺。我会的。它擅长零样本生成,可以处理复杂的提示和指令,以生成更丰富、更具交互性的 Web 用户界面。 Gemini 3是Google迄今为止创建的最好的Vibe编码和代理编码模型,使Google产品更加自主,并显着提高了开发人员效率。凭借令人印象深刻的 1487 Elo 分数,位居榜首编辑了 WebDev Arena 排名。此外,它在 Terminal Bench 2.0 测试中获得了 54.2% 的分数,该测试旨在评估模型使用工具通过终端与计算机交互的方式的能力。在衡量加密代理性能的 SWE 基准验证测试中,它的性能也显着优于版本 2.5 Pro(得分为 76.2%)。用户现在可以在 Google 新代理开发平台 Google Antigravity 上使用 Google AI Studio、Vertex AI、Gemini CLI 和 Gemini 3 进行构建。它还可以与第三方平台配合使用,例如 Cursor、GitHub、JetBrains、Manus 和 Replit。这就像创建一个具有更丰富的视觉效果和更好的交互性的3D复古太空飞船游戏。另一个例子是创建更丰富、更具交互性的 Web 应用程序和 UI。这意味着计划一些事情。自从Gemini 2代理以来,Gemini大大提高了规划长期任务的能力。 Gemini 3的规划能力在Vending-Bench 2测试中得到进一步证实。 Gemini 3位居榜首进行模拟自动售货机运营测试,并通过全程长期规划管理虚拟业务运营。在整个模拟运行的一年中,Gemini 3 Pro始终保持稳定的工具调用和决策一致性,在专注于任务目标的同时实现了更大的投资回报。 Joyaini 3 Pro展现出卓越的长期规划能力,并产生比其他尖端机型更高的回报。 Gemini Agent 还可以帮助整理您的 Gmail 收件箱。 Gemini 3 现已全面上市。从现在开始,新模型将分别通过 Gemini 应用程序和搜索 AI 模式向普通用户和订阅者提供。开发者和企业客户也可以通过AI Studio、Vertex AI等渠道进行访问。期待已久的深度思考模式将在未来几周内专门面向 Google AI Ultra 订阅者开放。此外,还有很多重要信息值得强调ng 基于之前泄露的模型卡。谷歌使用 TPU 从头开始​​训练这个模型。与 MoE 一样,它的输入为 100 万个代币,输出为 64,000 个代币,这意味着 MoE 可以更便宜地做到这一点。在定价方面,Gemini 3.0 Pro引入了基于上下文时长的分级定价机制。对于少于 200,000 个代币的任务,进入/退出价格为 2.00 美元/12.00 美元(每百万代币)。对于超过 200,000 个代币的任务,价格分别为 4.00 美元和 18.00 美元。新的“代理优先”开发体验 Google Antigravity 是 Google 的新代理开发平台,允许开发人员在更高的、面向任务的级别上工作。通过利用先进的推理功能、使用 Gemini 3 软件和代理编程,Google Antigravity 将 AI 支持从开发人员工具箱中的工具转变为积极的合作伙伴。谷歌Antigravity的核心是熟悉的AI IDE(集成开发环境)体验,但其代理已经升级为可直接访问编辑器、终端和浏览器的专用界面。代理代表您处理复杂的端到端任务,同时验证自己的代码。软件任务现在可以自主调度并同时执行。除了 Gemini 3 Pro 之外,Google Antigravity 还与 Google 最新的用于浏览器控制的 Gemini 2.5 计算机使用模型以及顶级图像编辑模型 Nano Banana(Gemini Image 2.5)紧密集成。上手体验既然Gemini 3 Pro预览版已经在AI Studio平台上发布,我们决定尝试一下。消息:SVG for SKYLINE NEW ANDORK 使用任何库来执行此操作,但请确保您可以将所有内容粘贴到 HTML 文件中并在 Chrome 中打开它。这很有趣而且很详细。没有人期望在单个代码块中实现完整的创造力和完整的美感。消息:创建一款视觉效果令人惊叹的太空入侵者游戏。 Pelican Bicycle 到目前为止,很多大型车型都出现过问题,但这次我们还测试了Gemini 3。消息:鹈鹕骑自行车的动画SVG。与之前的版本相比,Gemini 3 已经有了很大的进步,但仍然存在自行车踏板空转等 bug。将此更改为更清晰的消息。创建一个完全独立的动画 SVG(无外部文件或图像),展示一只骑自行车的可爱鹈鹕的侧面。这次用 Gemini 3 生成的自行车似乎没有踏板。在一项名为“到 2026 年底哪些公司将拥有最好的法学硕士?”的调查中。开始于他们使用他们的生成模型。回顾过去两年,从巴德(Gemini的前身)被解雇时的仓促应对和股价暴跌,到与谷歌DeepMind合并、创始人被赶下台、再到获得诺贝尔奖,谷歌完成了教科书式的大象转身。曾经定义变形金刚、如今“All in Gemini”的巨人,正在准备全面反击。至于能否终结这一切?他是“最好的法学硕士”辩论,坐下来让子弹(和服务器)飞一会儿。 https://blog.google/products/gemini/gemini-3/#gemini-3 文中视频链接:https://mp.weixin.qq.com/s/m5DnddinQuH_SxXEyUbYaA
特别提示:以上内容(包括图片、视频,如有)由体育平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

此条目发表在吃瓜热门分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注