誰かやったことある人いますか? はい、非常に直接的ですが、主に「数学の TTC」として組み立てられているわけではなく、エージェントの長期的な視点として組み立てられています。 ReSum (2025) は本質的に「定期的なコンテキスト要約 → 履歴の破棄 → 継続」であり、コンテキスト制限を明示的に動機付けており、エージェントが要約から推論するように訓練するための強化学習手法 (ReSum-GRPO) も提案しています (要約ポイントで軌跡をセグメント化し、軌跡の利点をセグメントに「ブロードキャスト」します)。ar5iv
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。