지능형 에이전트를 세뇌하세요: 기억을 깨끗하게 유지하는 방법 @CamelAIOrg 팀은 에이전트의 메모리 관리를 최적화하여 성능과 효율성을 향상시키는 컨텍스트 엔지니어링에 중점을 두고 있습니다. @Hesamation 저자는 에이전트가 실제로 "잊는" 것이 아니라 비효율적인 컨텍스트 관리로 인해 어려움을 겪는다고 강조합니다. 개발자는 컨텍스트를 제어함으로써 에이전트의 "지능" 수준에 상당한 영향을 미칠 수 있습니다. 본 논문에서는 CAMEL 프레임워크에서 메모리를 "깨끗하게" 유지하는 세 가지 기법, 즉 컨텍스트 요약, 워크플로 메모리, 그리고 도구 출력 캐싱을 소개합니다. 이러한 방법들은 에이전트가 작업 처리 시 흔히 발생하는 컨텍스트 팽창 문제를 해결하여 효율성을 향상시키고 비용을 절감하는 것을 목표로 합니다. 메모리 관리가 왜 필요할까요? 에이전트 워크플로에서 흔히 발생하는 문제로는 작업 탈선, 반복적인 작업, 그리고 도구 출력 과부하 등이 있습니다. 이러한 문제로 인해 컨텍스트 창이 빠르게 채워져 많은 양의 토큰과 시간이 소모될 수 있습니다. 3가지 핵심 기술 1. 맥락 요약: 핵심 내용 유지. 문제점 및 활용: 에이전트는 텍스트-이모지 변환 애플리케이션을 구축할 때 데이터베이스 디버깅에 지나치게 몰두하는 등 "부업"에 얽매여 주요 작업의 지연을 초래하는 경우가 있습니다. 이는 많은 리소스를 소모합니다. • 트리거 조건: 컨텍스트가 창의 80% 이상을 사용하는 경우, 컨텍스트가 추적을 벗어나 재설정해야 하는 경우, 또는 이전 세션이 새 세션에서 참조되는 경우. • CAMEL 구현: 토큰 임계값 기반 자동 요약, 수동 API 호출, 그리고 에이전트가 제공하는 툴킷을 사용한 요약의 세 가지 방법을 제공합니다. 요약 프로세스는 사용자의 주요 요청, 남은 작업, 현재 진행 상황과 같은 핵심 정보를 추출하기 위해 신중하게 설계된 프롬프트를 사용합니다. 동시에, LLM 요약에 대한 의존도를 줄이고 잠재적인 부정확성을 방지하기 위해 최소한의 사용자 메시지만 보존합니다. 이점: 상담원이 빠르게 집중력을 되찾는 데 도움이 되고 관련 없는 세부 사항으로 인한 주의 산만이 줄어듭니다. 2. 워크플로 메모리: 과거 경험으로부터의 학습. 문제 및 활용: 에이전트는 무료 머신 러닝 서적 목록을 작성하는 것과 같이 반복적인 작업에서 종종 노력을 반복하는데, 이 경우 archive.org에 접속할 때마다 문제를 해결해야 하지만 경험을 기억할 수 없습니다. • 핵심 설계: 워크플로 메모리는 과거 작업에 대한 구조화된 요약으로, 작업 제목(간략하고 일반적), 작업 설명(사용자 목표 요약, 구현 세부 사항 없음), 솔루션 단계(번호가 매겨진 일반 작업), 도구 목록(사용 설명), 오류 복구 전략(선택 사항), 메모 관찰(선택 사항), 태그(분류 및 매칭을 위한 3-10)를 포함합니다. • 로딩 메커니즘: 개발자는 에이전트 역할에 따라 세션을 지정하거나 파일을 로드할 수 있습니다. 에이전트는 워크플로 목록에서 가장 관련성이 높은 N개를 선택합니다(간단하게 하려면 RAG를 사용하지 마세요). • 연구 응용: 이 기사에서는 해당 방법이 네트워크 탐색 작업의 성능을 크게 향상시킨다고 언급하고 관련 논문을 인용했습니다. 이점: 지능형 에이전트가 경험을 재사용하고 반복적인 작업의 효율성을 개선할 수 있습니다. 3. 도구 출력 캐싱: 주의 사항 • 문제점 및 사용: 도구 출력(웹 검색 결과나 파일 콘텐츠 등)은 종종 장황합니다(예: 4250자의 검색 결과). 이를 장시간 컨텍스트에 보관하면 토큰이 폭발적으로 증가할 수 있습니다. • CAMEL 구현: 2000자를 초과하는 출력을 모니터링하고, 이전 출력은 외부 파일(예: 마크다운)에 저장하며, 컨텍스트 내에서는 참조 ID와 미리보기(처음 160자)만 유지합니다. 전체 출력을 검색하는 명령을 제공합니다. 과제 및 위험: 토큰을 절약할 수 있지만, 정보 손실(에이전트가 미리보기에 의존하고 세부 정보를 무시함)과 인지 부담 증가(ID 추적 및 검색 여부 결정 필요)로 이어질 수 있습니다. 본 논문에서는 효율성과 정확성의 균형을 맞추려는 시도로 보고 있으며, CAMEL에서 롤백되어 추가 최적화가 필요합니다. 이점 및 경고: 높은 출력을 처리하는 데 적합하지만 성능 저하를 방지하기 위해 주의가 필요합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
