[論文解説] 後知恵は20/20:保持、想起、そして反省能力を備えたインテリジェントエージェントの記憶の構築。この論文は@Vectorizeio、@virginia_tech、@washingtonpostによるものです。 主な背景:現状の問題点 現在のAIエージェントが長期タスクを処理する場合、記憶システムがしばしば弱点となります。現在主流のアプローチは、記憶を「外付けハードドライブ」のように扱うことです。つまり、会話から断片的な情報を抽出してデータベースに保存し、必要に応じて取り出してモデルに渡すというものです。 このアプローチには明らかな欠点があります。 • 証拠と推論の混同: このモデルでは、客観的な事実と直接的な推論を区別することが困難です。 • 整理されていない情報: 長期間にわたって蓄積された情報を、時間が経つにつれて効果的に整理することが難しくなります。 • 反省の欠如: インテリジェントエージェントは、人間とは異なり、過去の経験を「反省」して将来の行動を最適化するのに苦労します。 コアイノベーション:Hindsightアーキテクチャの研究者たちは、Hindsightと呼ばれる新しいメモリアーキテクチャを提案しました。このアーキテクチャは、記憶を単なるストレージコンテナとしてではなく、推論のための基本構造として扱います。このアーキテクチャは人間の記憶メカニズムを模倣し、情報を整理するための4つの論理ネットワークを設計します。 1. 世界の事実:客観的に存在する知識。 2. エージェントの経験:エージェント自身の経験と業務実績。 3. 包括的なエンティティの概要: 特定の人物、イベント、または物に関する知識の要約。 4. 進化的信念: 情報が更新されるにつれて動的に変化する見解や判断。 3 つのコア動作メカニズム: 保持: 上記の 4 つのネットワークに新しい情報を効果的に組み込む方法を決定します。 • 想起: 必要に応じて関連する記憶の断片を正確に検索します。 • 反省:これが最も印象的な部分です。システムは記憶バンクを通して積極的に推論し、古い信念を更新し、誤った認識を修正することで、「間違いから学ぶ」ことを実現します。 驚くべき実験結果は、AI モデルに自己組織化と反省が可能な脳を装備したようなもので、即座に顕著な効果をもたらします。 • ベンチマークの優位性:Hindsight は、長期記憶を測定するための主要なベンチマークである LongMemEval で 91.4% の精度を達成しました。 • 大手企業を上回るパフォーマンス: 比較すると、完全なコンテキスト ウィンドウを持つ GPT-4o でさえ、一部の長時間タスクでは Hindsight よりも優れたパフォーマンスを発揮します。 • 効率性の向上: 優れたメモリを備えているだけでなく、構造化されたデータを通じてモデルの認知負荷が軽減され、「錯覚」の可能性が低くなります。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
![[論文解説] 後知恵は20/20:保持、想起、そして反省能力を備えたインテリジェントエージェントの記憶の構築。この論文は@Vectorizeio、@virginia_tech、@washingtonpostによるものです。
主な背景:現状](https://pbs.twimg.com/media/G8X_QyuawAAzMDM.jpg)