X (Twitter)

AI に「筋肉の記憶」を装備する: エージェントはどのようにしてリアルタイムで学習し、「状態インデックスの経験」を通じて使用することでより賢くなるのでしょうか? 主な問題点: AIエージェントの「記憶喪失」現在の AI エージェントはインテリジェントですが、通常、導入後に学習できないという致命的な欠陥があります。 • モデルは「死んでいる」: モデルがトレーニングされ、展開されると、その知識は固定されます。 • 間違いから学ぶことの欠如: エージェントが今日複雑な Web ページで操作に失敗した場合、明日同じ Web ページに遭遇したときに同じ間違いを犯す可能性があります。 • 「筋肉の記憶」の欠如：人間は「試行錯誤」（手続き的知識）を通じてスキルを習得しますが、AIエージェントにはリアルタイムの経験からスキルを蓄積するこのメカニズムが欠けていることがよくあります。解決策: PRAXIS システムこの問題に対処するために、著者らは PRAXIS (Procedural Recall for Agents with eXperiences Indexed by State) と呼ばれる新しいメカニズムを提案しました。 PRAXIS は、エージェントの「リアルタイムエラーログ」または「経験メモ」と考えることができます。 • 経験の記録: エージェントがタスクを実行すると、PRAXIS はエージェントが実行するすべてのアクションとその結果を自動的にバックグラウンドで記録します。 • シーンマッチング：エージェントが同様のシーン（環境状態＋内部状態）に再度遭遇すると、PRAXIS は過去の経験を素早く取得します。 • 意思決定サポート: エージェントに「この画面で前回このボタンをクリックすると成功しました (または失敗しました)」と伝え、エージェントがより良い選択を行えるように直接ガイドします。主な技術的ポイント: 軽量プラグイン: PRAXIS は大規模なモデルの再トレーニングを必要とせず、低コストの外部メモリモジュールのようなものです。 • デュアルインデックス: 外部環境 (Web ページの外観など) だけでなく、エージェントの内部状態 (現在の計画など) も考慮することで、エクスペリエンスのマッチングの精度を確保します。実験結果：Webブラウジングタスクにおいて、圧倒的な成功を収めました。研究チームはREAL Web Browsing Benchmarkを用いて結果を評価した結果、以下のことが示されました。 • タスク完了率の向上: PRAXIS を搭載したエージェントは、複雑な Web ページタスクをより正確に完了できます。 • コスト効率の向上: 迂回を回避し、効果のない試行を削減することで、トークンの消費量と運用コストが大幅に削減されます。 • 高い適応性: これまでに見たことのないタスクでも、環境が類似している限り、エージェントは過去の経験からの類推によって問題を解決できます。業界への影響と結論: この論文では、AI エージェントが「自己進化」を実現するための低コストの道筋を提案しています。 • 「一度限りの」インテリジェンスはもう終わり: 将来のエージェントは、変化しないツールではなく、使えば使うほど便利でインテリジェントになるアシスタントになります。 • 動的環境の処理: 特に、Web ブラウジングやソフトウェア操作など、インターフェースが頻繁に変更されるシナリオでは、PRAXIS メカニズムにより、モデル製造元が新しいバージョンをリリースするのを待たずに、エージェントが人間と同じように新しいバージョンの UI に迅速に適応できます。紙

meng shao（@shao__meng）のスレッド

作者情報

スレッド内容