笑、GPT-5.2 がリリースされたばかりなのに、すでに奇襲攻撃を受けています。 GPT-5.2の発表イベントでは、その性能をアピールするために、コンピューターのマザーボード上のコンポーネントとインターフェースの識別マークを再現したケースが展示されていました。しかし、Google DeepMindのエンジニアである@bcaine氏が、このケースをGemini-3.0-proで直接実行したところ、見事にそれを凌駕するパフォーマンスを見せました。私も彼の手法で結果を再現してみましたが、全く問題なく動作しました。画像は私の再現結果です。ご覧の通り、Gemini-3.0-proのマークは非常に正確です。一方、このGPT-5.2のケースは、おそらく複数回の実行を経て選ばれたのでしょう… 具体的な方法は以下の通りです。 まず、GPT-5.2グラフをnano-banana-proに送信し、ラベルボックスを削除します。次に、ラベルなしのグラフをgemini-3.0-proに送り返します。プロンプトは次のとおりです。 画像内のすべてのコンポーネントとインターフェースの視覚的な境界ボックスに[0, 1000]の座標を使用してラベルを付け、Pythonスクリプトを使用して画像上にこれらの境界ボックスを表示する方法について教えてください。コンポーネントとインターフェースの種類ごとに異なる色のボックスを使用してラベルを付けてください。ユーザーマニュアルのように詳細に記述してください。 (コード実行ツールを有効にすることを忘れないでください) 私が実行したリンクは次のとおりです:https://t.co/KOoWrQvQrg、https://t.co/fCKDtdYzmr 元の投稿:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。



