X (Twitter)

Gemini 3.0 Pro 実世界テスト！SOTA！しかし、2つの重要な問題が発見されました！ Gemini 3.0 Pro プレビューのテスト結果は次のとおりです。象の歯磨き粉テストは最先端（SOTA）であり、驚くほど印象的なパーティクルエフェクトを備えています。象の歯磨き粉が噴き出す様子は、以前のKimi-K2-0905よりもさらにリアルです。さらに、三角フラスコのモデリングはGPT-5レベルに達しており、パーティクルエフェクトと物理モデリングの両方の側面が最先端です。ただし、液体の表面がフラスコの内壁に完全に密着していない点が問題です。この点では、claude-sonnet-4.5の方が優れています。花火の連鎖反応はかなり迫力がありましたが、カメラの揺れが激しかったため、花火がフレームから飛び出てしまいました。新しいトゥールビヨンムーブメントもテスト済みで、現在は最先端技術（SOTA）の段階にあります。クロードの歯車のモデリングには問題があるのに対し、ジェミニのモデリングは非常に正確です。もちろん、どちらも脱進機の実装が不十分です。 Python の水注入テストは、最先端の Opus 4.1 とほとんど区別がつきませんでした。次に、このモデルで発見した問題点について説明します。まず、このモデルはパフォーマンスを優先しているように見えます。Three.jsを使ってモデリングをテストしたシナリオでは、モデルの特定の面やパーティクルが見えなくなることがよくありました。これは、Three.jsがフラスタムカリングを頻繁に使用しているためです。フラスタムカリングとは、フレーム内にないものをレンダリングしない処理のことです。しかし、計算ミスが頻繁に発生し、本来カリングすべきでないものをカリングしてしまうという問題がありました。カーソル使用中に遭遇したもう一つの重要な問題は、モデルコンテキストが約100Kに達するとモデルのパフォーマンスが急激に低下し、ツール呼び出しが失敗するというものでした。大規模なコンテキストでのモデルパフォーマンスには細心の注意を払うことを強くお勧めします。現時点では、これがバグなのか、それともモデル自体の問題なのかは不明です。結論として、素晴らしいですね！皆さんも今すぐ自分のコーディングモデルに切り替えて試してみることをお勧めします。Anthropicは今頃、汗だくになっていることでしょう。GoogleもGemini 3のリリースに合わせて独自のAI IDEをリリースしました。彼らは本当に真剣に取り組んでいます。最後に、冒頭でご紹介したサターンVロケットエンジンは、幾度かの改良を経てジェミニ3号で実現されました。その結果について、どう思われますか？ #gemini #gemini3 #gemini3pro #google #KCORES 大型モデルアリーナ

karminski-牙医（@karminski3）のスレッド

作者情報

スレッド内容