在OpenAI 宣稱將要反擊的時候 Google 再放大招,提前把OpenAI 摁在地上摩擦😅 Google 推出Gemini 3 Deep Think 超強深度推理模型 在所有高難度測驗中,均拿下最高分 在ARC-AGI-2測試中評分是GPT 5.1的2.5倍 它支持並行思考:可以同時探索多個假設(而不是一步步線性推理) 這是通用人工智慧(AGI)評測的「聖杯」等級基準ARC-AGI-2測試中: 達到前所未有的45.1% 準確率。 🤯 是GPT-5.1:17.6% 的2.5倍 在Humanity's Last Exam測驗中:無需工具即達到41.0% 準確率; 在GPQA Diamond 高精度的科學知識問答評估中。 Gemini 3 Deep Think 達到接近滿分的表現。
一個實例 指令內容: 在一個單一的HTML 檔案中,建立一個程式化渲染的類地行星… 左(Gemini 3 Pro):“敷衍了事” 畫了一個發光的白球,外面套了一個簡單的圈。 右邊(Gemini 3 Deep Think):“超級學霸” 直接做出了一個好萊塢大片等級的3D 地球!

