Gemini-3-Pro-Preview 的EQBench 測試結果出了 情緒智商測驗和創意寫作都沒打過Kimi-K2-Thinking, 感覺這次Gemini-3-Pro-Preview 完全是面向前端代碼,空間,以及視覺模態優化了,現在Gemini-3-Pro-Preview 最強的場景是給一個設計圖就能還原,這個做得非常好。而寫作/諮商之類的場景沒有看到太亮眼的表現。當然,即使沒霸榜,分數也相當高了。
leaderboard
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月22日 晚上10:53
Gemini-3-Pro-Preview 的EQBench 測試結果出了 情緒智商測驗和創意寫作都沒打過Kimi-K2-Thinking, 感覺這次Gemini-3-Pro-Preview 完全是面向前端代碼,空間,以及視覺模態優化了,現在Gemini-3-Pro-Preview 最強的場景是給一個設計圖就能還原,這個做得非常好。而寫作/諮商之類的場景沒有看到太亮眼的表現。當然,即使沒霸榜,分數也相當高了。
leaderboard