Xiaohongshuは、ツールを呼び出す機能を備えたマルチモーダルモデル「DeepEyesV2」をリリースしました。DeepEyesV2は、ツールを自ら見つけ、画像を閲覧し、コードを記述し、Webページを検索し、ツールを組み合わせて複雑な問題を解決できます。 タスク適応型で、現在のタスクの性質に基づいて最も適切なツールをインテリジェントに選択できます。また、複数のツールを組み合わせて複雑な問題を解決することもできます。 現在のコンテキスト情報に基づいて、ツールを呼び出すかどうか、どのツールを呼び出すかを選択的に決定できます。 FVQA-test、MMSearch、SimpleVQA、その他の検索モデルにおいて、GPT-4o、Gemini 2.5 Pro、その他の検索モデルよりも優れたパフォーマンスを発揮します。 #ディープアイズV2 #エージェントMLLM
github:github.com/Visual-Agent/D…
