Gemini 3深夜到来：压倒GPT 5.1，伟大的Google模式时代已经到来

《机器之心》报道称，《机器之心》社论 Gemini 3 尚未出现，Twitter 率先崩溃。没有比 Gemini 3 的发布更令人期待的了。从过去三个月 Gemini 的更新频率来看，AI 社区自 9 月份以来就对 Gemini 3 翘首以盼。今天，谷歌开发者关系主管兼谷歌AI工作室负责人发布了一条推文，其中仅包含“Gemini”一词。数月的期待终于达到了临界点，推特上的相关话题瞬间沸腾。有趣的是，随着发布日期的临近，Twitter“因应情况”多次崩溃。 “幕后罪魁祸首”是 Cloudflare，但这次崩溃的时间是如此精确，以至于人们怀疑是否有其他人在幕后黑手（安静的板球：毕竟，Twitter 是各种模型的主要推广中心）。目前还不清楚马斯克现在在想什么，因为他今天早上刚刚发布了 Grok 4.1。不管怎样，网友们已经被表情包淹没了。此前，Gemini 3终于正式亮相。让我们看看他在聚光灯下的实力有多强。事实证明，谷歌最聪明的模型并没有让那些等待的人失望。 Gemini 3正式发布，重新定义SOTA。奥特曼和马斯克也发来贺电。谷歌将其定义为“迈向AGI的重要一步”，强调它是世界上最深入的交互和多模态理解智能代理。除了更新基本推理能力的SOTA标准外，Gemini 3还尝试通过推出全新的Google Antigravity平台和Deep Think模式来重塑开发者生态和AI辅助体验。称霸榜单的推理怪兽Gemini 3 Pro，官方被称为“推理模型下一代AI”。几乎所有的 lord 在当前的 AI 基准测试中均显着优于上一代 Gemini 2.5 Pro，并远超关键竞争对手或如 Claude Sonnet 4.5 和 GPT-5.1。 Gemini 3 Pro 以 1501 的历史 Elo 分数荣登 LMArena 排行榜榜首，在 Humanity’s Last Exam（无工具情况下 37.5%）和 GPQA Diamond（91.9%）中取得最高分，展现了博士级别的推理能力。我们还在 MathArena Apex 中实现了 23.4% 的最先进 SOTA，为最先进的数学模型设立了新标准。除了文本和逻辑之外，Gemini 3 Pro还重新定义了多模态推理的极限。它在MMMU-Pro和Video-MMMU中分别获得了81%和87.6%的高分。更引人注目的是，在 SimpleQA Verified 上得分为 72.1%，这显着提高了其客观准确性。它不仅功能强大，而且可靠。作为一款不讨人喜欢的思想伴侣，Gemini 3 Pro 的进步不仅在于它的运行分数，还在于它的交互质量。摆脱过去人工智能常见的陈词滥调和夸张的陈词滥调，告诉它们智能简洁、直接，不仅是你想听的，也是你需要听的。它是一个真正的思考伙伴，提供理解信息和表达自己的新方法，从翻译晦涩的科学概念到生成高保真可视化代码的创造性头脑风暴。 Gemini 3 编写了代码来可视化托卡马克内部的等离子体流，创作了一首捕捉聚变物理原理的诗。 Gemini 3 Deep Think Gemini 3 Deep Think 模式进一步突破了信息智能的界限，显着提升了 Gemini 3 的多模式理解和推理能力，帮助您解决更复杂的问题。在测试中，GemiEl ni 3 Deep Think 在 Humanity’s Last Exam（无工具情况下得分 41.0%）和 GPQA Diamond（得分 93.8%）两方面都超越了 Gemini 3 Pro 本来就很优秀的成绩。此外，它在 ARC-AGI-2（代码执行，ARC 奖验证）中取得了前所未有的 45.1% 的分数，展示了其解决全新挑战的能力。 Gemini 3 的 Deep Think 模式在一些最严格的 AI 基准测试中表现出色。学习、创建、计划学习任何内容 Gemini 的设计初衷是无缝集成任何主题的多种方式的信息，包括文本、图像、视频、音频和代码。 Gemini 3 结合了先进的推理能力、视觉和空间理解、尖端的多语言性能以及百万级令牌上下文 ntana，进一步突破多模态推理的界限，让您以最适合您的方式进行学习。例如，如果您想学习如何准备传统的家常饭菜，Gemini 3可以解释和翻译不同语言的手写食谱，并生成您可以与家人分享的食谱。或者，如果您想学习新主题，我们提供的教程可以生成学术文章、长视频讲座或交互式抽认卡、可视化或其他形式的代码来帮助您你获得知识。您还可以分析匹克球比赛的视频，以确定需要改进的领域，并制定训练计划来帮助您提高整体比赛水平。搜索 AI 模型现在使用 Gemini 3 来实现新功能，帮助您更好地理解网络信息。生成式 UI 体验（如沉浸式视觉设计、交互式工具和模拟）是根据查询动态生成的。了解复杂的主题，例如 RNA 聚合酶如何在 AI 模式生成 UI 中工作。以一切为基础在 2.5 Pro 的成功基础上，Gemini 3 兑现了让每个开发人员的想法成为现实的承诺。我会的。它擅长零样本生成，可以处理复杂的提示和指令，以生成更丰富、更具交互性的 Web 用户界面。 Gemini 3是Google迄今为止创建的最好的Vibe编码和代理编码模型，使Google产品更加自主，并显着提高了开发人员效率。凭借令人印象深刻的 1487 Elo 分数，位居榜首编辑了 WebDev Arena 排名。此外，它在 Terminal Bench 2.0 测试中获得了 54.2% 的分数，该测试旨在评估模型使用工具通过终端与计算机交互的方式的能力。在衡量加密代理性能的 SWE 基准验证测试中，它的性能也显着优于版本 2.5 Pro（得分为 76.2%）。用户现在可以在 Google 新代理开发平台 Google Antigravity 上使用 Google AI Studio、Vertex AI、Gemini CLI 和 Gemini 3 进行构建。它还可以与第三方平台配合使用，例如 Cursor、GitHub、JetBrains、Manus 和 Replit。这就像创建一个具有更丰富的视觉效果和更好的交互性的3D复古太空飞船游戏。另一个例子是创建更丰富、更具交互性的 Web 应用程序和 UI。这意味着计划一些事情。自从Gemini 2代理以来，Gemini大大提高了规划长期任务的能力。 Gemini 3的规划能力在Vending-Bench 2测试中得到进一步证实。 Gemini 3位居榜首进行模拟自动售货机运营测试，并通过全程长期规划管理虚拟业务运营。在整个模拟运行的一年中，Gemini 3 Pro始终保持稳定的工具调用和决策一致性，在专注于任务目标的同时实现了更大的投资回报。 Joyaini 3 Pro展现出卓越的长期规划能力，并产生比其他尖端机型更高的回报。 Gemini Agent 还可以帮助整理您的 Gmail 收件箱。 Gemini 3 现已全面上市。从现在开始，新模型将分别通过 Gemini 应用程序和搜索 AI 模式向普通用户和订阅者提供。开发者和企业客户也可以通过AI Studio、Vertex AI等渠道进行访问。期待已久的深度思考模式将在未来几周内专门面向 Google AI Ultra 订阅者开放。此外，还有很多重要信息值得强调ng 基于之前泄露的模型卡。谷歌使用 TPU 从头开始训练这个模型。与 MoE 一样，它的输入为 100 万个代币，输出为 64,000 个代币，这意味着 MoE 可以更便宜地做到这一点。在定价方面，Gemini 3.0 Pro引入了基于上下文时长的分级定价机制。对于少于 200,000 个代币的任务，进入/退出价格为 2.00 美元/12.00 美元（每百万代币）。对于超过 200,000 个代币的任务，价格分别为 4.00 美元和 18.00 美元。新的“代理优先”开发体验 Google Antigravity 是 Google 的新代理开发平台，允许开发人员在更高的、面向任务的级别上工作。通过利用先进的推理功能、使用 Gemini 3 软件和代理编程，Google Antigravity 将 AI 支持从开发人员工具箱中的工具转变为积极的合作伙伴。谷歌Antigravity的核心是熟悉的AI IDE（集成开发环境）体验，但其代理已经升级为可直接访问编辑器、终端和浏览器的专用界面。代理代表您处理复杂的端到端任务，同时验证自己的代码。软件任务现在可以自主调度并同时执行。除了 Gemini 3 Pro 之外，Google Antigravity 还与 Google 最新的用于浏览器控制的 Gemini 2.5 计算机使用模型以及顶级图像编辑模型 Nano Banana（Gemini Image 2.5）紧密集成。上手体验既然Gemini 3 Pro预览版已经在AI Studio平台上发布，我们决定尝试一下。消息：SVG for SKYLINE NEW ANDORK 使用任何库来执行此操作，但请确保您可以将所有内容粘贴到 HTML 文件中并在 Chrome 中打开它。这很有趣而且很详细。没有人期望在单个代码块中实现完整的创造力和完整的美感。消息：创建一款视觉效果令人惊叹的太空入侵者游戏。 Pelican Bicycle 到目前为止，很多大型车型都出现过问题，但这次我们还测试了Gemini 3。消息：鹈鹕骑自行车的动画SVG。与之前的版本相比，Gemini 3 已经有了很大的进步，但仍然存在自行车踏板空转等 bug。将此更改为更清晰的消息。创建一个完全独立的动画 SVG（无外部文件或图像），展示一只骑自行车的可爱鹈鹕的侧面。这次用 Gemini 3 生成的自行车似乎没有踏板。在一项名为“到 2026 年底哪些公司将拥有最好的法学硕士？”的调查中。开始于他们使用他们的生成模型。回顾过去两年，从巴德（Gemini的前身）被解雇时的仓促应对和股价暴跌，到与谷歌DeepMind合并、创始人被赶下台、再到获得诺贝尔奖，谷歌完成了教科书式的大象转身。曾经定义变形金刚、如今“All in Gemini”的巨人，正在准备全面反击。至于能否终结这一切？他是“最好的法学硕士”辩论，坐下来让子弹（和服务器）飞一会儿。 https://blog.google/products/gemini/gemini-3/#gemini-3 文中视频链接：https://mp.weixin.qq.com/s/m5DnddinQuH_SxXEyUbYaA
特别提示：以上内容（包括图片、视频，如有）由体育平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。

Gemini 3深夜到来：压倒GPT 5.1，伟大的Google模式时代已经到来

发表回复取消回复

近期文章

近期评论

归档

分类

Gemini 3深夜到来：压倒GPT 5.1，伟大的Google模式时代已经到来

发表回复 取消回复

近期文章

近期评论

发表回复取消回复