X (Twitter)

在OpenAI 宣稱將要反擊的時候 Google 再放大招，提前把OpenAI 摁在地上摩擦😅 Google 推出Gemini 3 Deep Think 超強深度推理模型在所有高難度測驗中，均拿下最高分在ARC-AGI-2測試中評分是GPT 5.1的2.5倍它支持並行思考：可以同時探索多個假設（而不是一步步線性推理）這是通用人工智慧（AGI）評測的「聖杯」等級基準ARC-AGI-2測試中：達到前所未有的45.1% 準確率。 🤯 是GPT-5.1：17.6% 的2.5倍在Humanity's Last Exam測驗中：無需工具即達到41.0% 準確率；在GPQA Diamond 高精度的科學知識問答評估中。 Gemini 3 Deep Think 達到接近滿分的表現。

一個實例指令內容：在一個單一的HTML 檔案中，建立一個程式化渲染的類地行星… 左（Gemini 3 Pro）：“敷衍了事” 畫了一個發光的白球，外面套了一個簡單的圈。右邊（Gemini 3 Deep Think）：“超級學霸” 直接做出了一個好萊塢大片等級的3D 地球！

詳細介紹：mp.weixin.qq.com/s/HBjImmlRP6bl…

来自小互（@imxiaohu）的推文线程

作者信息

线程正文