クロード・コードに匹敵する精度で4倍高速化:@relace_ai の「新しいコード検索アーキテクチャ」の詳細な分析 🚀 コア概要: Fast Agentic Search (FAS) とは何ですか? FASはRelaceの最新リリースであり、コードベース検索タスク向けに特別に設計された小型のインテリジェントエージェントモデルです。強化学習を用いて最適化されており、grepやviewなどのツールを並列に呼び出すことで、ユーザーリクエストに関連するコードファイルを迅速に見つけることができます。 💡 背景: RAGとエージェント検索のジレンマ ラグ 利点: 非常に高速でコストが低い。 • デメリット:複雑なコードロジックには十分な精度が得られないことが多い。ベクトルの類似性に依存しており、推論能力に欠け、重要なコンテキストを見逃すことが多い。 エージェント検索 • 利点:非常に正確です。このモデルは人間のプログラマーのように動作し、段階的に推論し、ファイルを調べ、参照にジャンプすることでコードを見つけます。 • デメリット:速度が遅く、コストが高い。通常は「シリアル」操作(考える→ファイルの検索→もう一度考える→次のファイルの検索)を伴うため、レイテンシが高くなります。 FAS のエントリ ポイント: Agentic Search の推論の深さと RAG の応答速度という両方の利点を組み合わせようとします。 🛠️ 技術的な説明: FAS はこれをどうやって実現するのでしょうか? FAS の成功は、主に次の 3 つの主要な技術戦略に依存します。 1. 並列ツール呼び出し 通常のインテリジェントエージェントが「一度に1つのファイルを検索する」のとは異なり、FASは複数のコマンドを同時に発行するように訓練されています。例えば、4~12個の異なるファイルパスを表示したり、複数の検索コマンドを同時に実行したりできます。これにより、複数ターンの対話によって発生するネットワーク遅延が大幅に削減されます。 2. 専用強化学習(オンポリシーRL) 通常の教師あり微調整 (SFT) のみを使用する代わりに、チームは強化学習環境を構築しました。 • 報酬関数:特別な報酬式が設計されています。「正確なターゲティング」(高い再現率と精度)に報酬を与え、「遅い行動」(探索ラウンドの実行回数が多すぎるとスコアが減少)にペナルティを与えます。 創発的な推論能力:トレーニングの後期段階で、モデルは大規模な並列探索を実行する前に推論のステップを実行するという戦略を「学習」しました。これは、モデルが盲目的に推測しているのではなく、論理的に並行して動作していることを証明しています。 3. タスク分離(サブエージェントアーキテクチャ) 記事のデータ分析により、実際のプログラミングタスクでは、約 60% のトークンが「コードの検索」ステップで消費されることが明らかになりました。 そのため、「探索」をメインエージェントから分離し、専用の小型モデル FAS に委託することで、メインモデルの高価なトークンを節約できるほか、無関係なコンテキストがメインモデルの判断に干渉するのを防ぐことができます。 📊 実際のテスト結果:速度と精度:同じ精度で、FAS は従来のシリアルエージェント検索よりも 4 倍高速です。 • SWE ベンチ テスト: FAS をコード化されたエージェントに統合した後、平均レイテンシが 9.3% 削減され、トークン消費量が 13.6% 削減されました。 • 注: 実際の複雑な開発シナリオでは (明確に定義されたベンチマークと比較して)、検索の割合が高くなるため、パフォーマンスの向上がより顕著になると予想されます。 📝 要約と考察 この記事は、単に新機能のリリースについて述べているだけではありません。AI エージェントの開発における重要なトレンド、「万能の大規模モデル」から「専門家によるサブモデルの連携」への移行を示しています。 特化した強化学習で学習した小規模モデルを用いて単一の「探索」ステップを最適化することで、高価で大規模なモデルの全体的なパフォーマンスを、より低コストかつ高速に達成、あるいは凌駕することが可能になります。これは、将来的に、より効率的なAIプログラミングアシスタントを構築するための明確な道筋となります。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
