Gemini-3-Pro-Preview 的EQBench 測試結果出了 情緒智商測驗和創意寫作都沒打過Kimi-K2-Thinking, 感覺這次Gemini-3-Pro-Preview 完全是面向前端代碼,空間,以及視覺模態優化了,現在Gemini-3-Pro-Preview 最強的場景是給一個設計圖就能還原,這個做得非常好。而寫作/諮商之類的場景沒有看到太亮眼的表現。當然,即使沒霸榜,分數也相當高了。
leaderboard
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月22日 22:53
Gemini-3-Pro-Preview 的EQBench 測試結果出了 情緒智商測驗和創意寫作都沒打過Kimi-K2-Thinking, 感覺這次Gemini-3-Pro-Preview 完全是面向前端代碼,空間,以及視覺模態優化了,現在Gemini-3-Pro-Preview 最強的場景是給一個設計圖就能還原,這個做得非常好。而寫作/諮商之類的場景沒有看到太亮眼的表現。當然,即使沒霸榜,分數也相當高了。
leaderboard