Alibaba は最近、エンドツーエンドの「自己進化型」インテリジェント エージェント トレーニング フレームワークである AgentEvolver をリリースしました。これは、質問、ナビゲーション、自己帰属という 3 つのメカニズムを 1 つのシステムに統合したものです。 これにより、インテリジェント エージェントは環境内で継続的に反復処理を実行できるようになり、手動でデータを継続的にラベル付けする必要がなくなります。 AgentEvolver 7B は、AppWorld avg@8 で平均スコア 32.4%、BFCL-v3 で平均スコア 57.9% を達成し、平均スコア 45.2% を達成して、14B のベースラインを上回りました。 バージョン 14B はさらに改良され、平均スコア 57.6%、ピークパフォーマンス 73.1% を達成しました。 今後のアップデートでは、マルチエージェントの協調進化と、調査、検索、帰属を含む 3 段階のクローズドループ共同最適化プロセスがサポートされます。 #AIエージェント #エージェントエボルバー
ギットハブ: github.com/modelscope/Age…


