このスタンフォード大学の論文は読む価値がある👇🏻 彼らは、人間による注釈や、慎重に設計されたタスク、デモンストレーションなしで、ゼロのデータから AI エージェント フレームワークを構築しましたが、それは既存のすべてのセルフゲーム手法を上回りました。 このフレームワークは Agent0 と呼ばれ、ツールを通じて推論を統合することで、ゼロデータから自己進化型インテリジェントエージェントを解放します。 その成果は信じられないほどです。 これまで見てきた「自己改善型」エージェントにはすべて、致命的な欠陥が 1 つあります。それは、既に知っているタスクよりも少しだけ難しいタスクしか生成できないため、すぐにボトルネックになってしまうことです。 Agent0 はこの天井を破りました。 重要なポイントは次のとおりです。 同じ基礎 LLM から 2 つのエージェントを生成し、それらを競合させます。 • コースエージェント - 徐々に難易度が上がるタスクを生成します。 • 実行エージェント - 推論とツールを使用してこれらのタスクを解決しようとします。 実行エージェントが向上するたびに、コースエージェントは難易度を上げることを余儀なくされます。 タスクが困難になるたびに、実行エージェントは進化を余儀なくされます。 これにより、閉ループの自己強化型カリキュラムスパイラルが生まれ、データも人も何もない状態からすべてが始まりました。 それは単に、2 つのインテリジェント エージェントが互いに刺激し合い、より高いレベルのインテリジェンスを実現するというものです。 その後、チートコードが追加されました。 完全な Python ツール インタープリターはループ内にあります。 実行エージェントは、コードを通じて問題について推論することを学習します。 コースエージェントは、ツールの使用を必要とするタスクを作成する方法を学習します。 したがって、両方のインテリジェント エージェントは継続的にアップグレードされます。 そして結果はどうだったでしょうか? → 数学的推論能力が18%向上 → 一般的な推論能力が24%向上 → R-Zero、SPIRAL、Absolute Zero、さらには外部の独自 API を使用するフレームワークよりも優れています → これらはすべてゼロ データから生成され、単純に自己進化サイクルです。 彼らは、反復プロセス中に難易度曲線が上昇することを実証しました。タスクは基本的な幾何学から始まり、最終的には制約充足、組み合わせ論、論理パズル、および複数ステップのツール依存の問題に到達します。 これは、LLM における自律的な認知的成長に最も近いものです。 Agent0 は単なる「より優れた RL」以上のものです。 これは、インテリジェントエージェントが自身のインテリジェンスを導くための青写真です。 インテリジェントエージェントの時代が始まりました。
読み始める前に、この投稿に「いいね!」、共有、または保存することを忘れないでくださいxaicreator.com人間とコンピュータの共同コンテンツ エンジンによって公開されました。 https://t.co/Gxsobg3hEN
コアとなるアイデア:Agent0は、同じLLMから2つのエージェントを作成し、それらを競争的なフィードバックループに強制的に組み込む。一方がタスクを考案し、もう一方が生き残りを目指す。この継続的なプッシュ・プルによって、静的データセットでは比類のない最先端の難易度問題が生み出される。
ブレークスルーは自己対戦ではなく、ツール統合推論にあります。実行エージェントは、ソリューション内で実際のPythonコードを実行し、出力を取得し、推論を更新できます。これにより、カリキュラムエージェントはツールの使用を必要とする質問を作成することで応答できます。これは好循環です。
彼らは、自己進化型エージェントの最大の失敗モードである停滞に対処しました。ほとんどのエージェントは、現在のレベルよりもわずかに難しい問題しか生成しません。Agent0は、不確実性、サンプル回答間のarxiv.org/abs/2511.16043ントの弱点を検出します。論文全文はこちら:https://t.co/7UheEMgrBw
私の個人的な理解では、これは本質的にLLMを用いて2つのエージェントを競合させるように構築するものであり、これもまたGANの思考ロジックの一種です。言い換えれば、陰陽の対立を絶えず解決していく過程で発達が形成されるということです。しかし、このシステムを機能させるには、エージェントに「道具を探索し、創造する」能力を与えずにはいられません。この能力があれば、エージェントは強化学習を通して世界と継続的に衝突し、最終的に問題の解決策を見つけることができます。これは人間の実践に似ています。
最後に、このツイートを読んでいただきありがとうございます! AI 情報、ビジネス洞察、成長戦略については、@Yangyixxxx をフォローしてください。 このコンテンツをお楽しみいただけましたら、最初のツイートに「いいね!」や「シェア」をして、より多くの人に貴重な情報を広めてください。



