Gemini-3-Pro-Preview の EQBench テスト結果が公開されました。 感情知能テストもクリエイティブライティングテストも、Kimi-K2-Thinkingを上回る成績を残しませんでした。このGemini-3-Pro-Previewは、フロントエンドのコード、スペース、そしてビジュアルモダリティに完全に最適化されているようです。Gemini-3-Pro-Previewの現在の最大の強みは、与えられたスケッチからデザインを再現する能力であり、これは非常に優れています。しかし、ライティング/コンサルティングのシナリオでは特に優れたパフォーマンスは示しませんでした。もちろん、チャートを席巻していなくても、そのスコアは依然としてかなり高いです。
リーダーボード


