我的天! Gemini 3 Deep Think 甚至比 Gemini 3 Pro 性能還要好。 - 人類最後一次考試的得分為 41%。 - ARC-AGI-2 得分 45.1% 谷歌在Transformer發布後重奪人工智慧領域的主導地位。這或許是一個時代的轉捩點。 OpenAI能否迎頭趕上?
所以 Grok 4.1 只排名第一一天…
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月18日 下午4:16
我的天! Gemini 3 Deep Think 甚至比 Gemini 3 Pro 性能還要好。 - 人類最後一次考試的得分為 41%。 - ARC-AGI-2 得分 45.1% 谷歌在Transformer發布後重奪人工智慧領域的主導地位。這或許是一個時代的轉捩點。 OpenAI能否迎頭趕上?
所以 Grok 4.1 只排名第一一天…