マルチエージェントシステムは期待外れになることが多いですか? 問題はエージェント自体にあるのではなく、エージェントがどのように組織化されているかにあるのかもしれません。 ほとんどのシステムでは、タスクの変更に応じて調整できない固定のチェーン、ツリー、またはグラフ構造が使用されます。 しかし、システムが独自のコラボレーションパターンを学習できたらどうなるでしょうか? この画期的な論文では、事前に設計されたトポロジに依存するのではなく、エージェントを動的にオーケストレーションできる Puppeteer と呼ばれるフレームワークを紹介しています。 重要なポイントは次のとおりです。 • 事前に定義されたコラボレーション構造の代わりに、コーディネーターは常に変化する対話状態に基づいて次に話すエージェントを選択します。 • REINFORCE アルゴリズムのトレーニング戦略は、タスクの成功率を直接最適化します。 • 複雑なグラフトポロジを検索する代わりに、すべてのコンテンツを連続的なエージェントの選択肢にシリアル化することで、組み合わせの複雑さを回避します。 結果は驚くべきものでした。 これにより、2〜3 個のエージェントがほとんどの作業を処理する大規模なグラフ構造ではなく、コンパクトで循環的なパターンが自然に生まれます。 さらに驚くべきことに、このシステムは自らの効率性を自律的に検出することができます。 結果ショーケース: • GSM-Hard の数学問題では、精度は 70% に達します (ベース モデルを単独で使用した場合の精度はわずか 13.5%)。 • MMLU-Proでは83%(ベースライン76%)。 • SRDDソフトウェア開発:76.4%(ベースライン60.6%)。 これらの改善にはトークンコストの削減が伴います。 この論文では、トレーニング プロセス全体を通じてトークン コストが継続的に減少し、パフォーマンスが向上することが示されています。 また、エージェント選択プロセスがマルコフ特性を満たすことも証明しました。これは、履歴全体を追跡しなくても、現在の状態から最適な次のエージェントを決定できることを意味します。 それで: AI 開発者にとって、学習のシンプルさは複雑なものよりも優れています。 トレーニングされたルーターは、いくつかの特殊なインテリジェント エージェントと組み合わせることで、計算オーバーヘッドを削減しながら、適切に設計されたワークフローよりも優れたパフォーマンスを発揮できます。
このコンテンツはxaicreatorにxaicreator.comco/Gxsobg3hEN
論文リンクopenreview.net/pdf/9727f658d7…bC
このツイートを読んでいただきありがとうございます! AI情報、ビジネスインサイト、成長戦略については、@Yangyixxxxをフォローしてください。このコンテンツが気に入ったら、最初のツイートに「いいね!」とシェアをして、より多くの人に有益な情報を広めてください。
