X (Twitter)

효율적인 프로덕션 등급 컨텍스트 인식 다중 에이전트 프레임워크 구축 이 공식 Google 블로그 게시물에서는 체계적인 "컨텍스트 엔지니어링"을 통해 복잡한 AI 에이전트를 개발할 때 정보 과부하로 인해 발생하는 성능 병목 현상을 해결하는 방법을 자세히 설명하며, Google ADK를 예로 들어 완전히 새로운 아키텍처 설계 개념을 제안합니다. 핵심 과제: 컨텍스트 병목 현상 지능형 에이전트가 처리하는 작업이 점점 더 복잡해짐에 따라(예: 장기 워크플로, 심층 연구, 코드 유지 관리) 추적해야 하는 정보의 양도 기하급수적으로 증가합니다. 단순히 모델의 "컨텍스트 창"을 확장하는 것은 장기적인 해결책이 아니며, 다음과 같은 세 가지 주요 문제에 직면하게 됩니다. • 비용 및 지연: 컨텍스트가 길수록 추론 비용이 높아지고 응답 시간이 느려집니다. • 신호 감쇠: 관련 없는 로그나 오래된 정보가 많으면 모델이 "손실"되어 주요 지침을 포착하지 못할 수 있습니다(중간에서 손실). • 물리적 제한: 실제 시나리오에서는 데이터 양(RAG 검색 결과나 전체 대화 기록 등)이 결국 고정된 창 제한을 초과하게 됩니다. 핵심 개념: 컨텍스트는 "컴파일 뷰"입니다. 이 기사에서는 사고방식의 근본적인 전환을 제안합니다. 즉, 컨텍스트를 계속 추가되는 문자열 버퍼로 보는 대신, 기본 상태에 대한 "편집된 관점"으로 보아야 한다는 것입니다. • 소스 데이터: 전체 세션 로그, 장기 메모리 및 파일. • 컴파일러: 데이터 필터링, 정렬, 변환을 담당하는 일련의 처리 단계입니다. • 보기: 최종적으로 LLM에 전송되는 "작업 컨텍스트"입니다. 주요 아키텍처 설계 A. 계층 구조 ADK는 컨텍스트 데이터를 4가지 수준으로 나누어 "저장"과 "표현"을 구분합니다. • 작업 컨텍스트: 현재 통화에만 사용되는 즉석 프롬프트입니다. 임시적이고 최적화된 프롬프트입니다. • 세션: 사용자 메시지, 도구 호출, 오류 메시지 등을 포함하는 체계적이고 지속적인 상호작용 로그입니다. 객관적인 "사실"입니다. • 메모리: 세션 전반에 걸쳐 존재하는 장기 지식(사용자 선호도 등)입니다. • 아티팩트: 대용량 데이터 객체(예: PDF, CSV, 긴 로그). 이름/버전으로만 참조되며 프롬프트에 직접 붙여넣을 수 없습니다. B. 배관 프로세스(흐름 및 프로세서) 개발자는 정렬된 "프로세서 체인"을 정의함으로써 컨텍스트 생성을 빌딩 블록처럼 제어할 수 있습니다. 예를 들어, 먼저 권한 검사를 수행하고, 시스템 명령어를 삽입하고, 마지막으로 압축된 히스토리를 삽입할 수 있습니다. 이를 통해 컨텍스트 구축 과정을 관찰하고 테스트할 수 있습니다. C. 지능형 관련성 관리 맥락을 "간결하게" 유지하기 위해 시스템과 에이전트는 함께 작업하여 현재 필요한 정보가 무엇인지 확인합니다. • 요청 시 아티팩트 로드: 기본적으로 에이전트는 파일 이름에 대한 참조만 확인합니다. 콘텐츠를 확인해야 한다고 확신할 때만 아티팩트를 임시로 로드하는 도구를 호출합니다. 이 프로세스는 사용 후 삭제되므로 컨텍스트가 영구적으로 오염되는 것을 방지합니다. • 능동/수동 메모리 검색: 도구를 사용하여 관련 장기 메모리를 능동적으로 검색하거나 전처리기를 통해 자동으로 주입합니다. • 압축 및 필터링: 세션 수준에서 백그라운드 작업을 자동으로 실행하여 오래된 상세 로그를 요약으로 "압축"하거나 규칙에 따라 쓸모없는 노이즈를 직접 필터링합니다. D. 다중 에이전트 컨텍스트 다중 에이전트 시스템에서 ADK는 컨텍스트 폭발과 환상을 방지하기 위해 엄격한 범위 제어를 사용합니다. • 주문형 핸드오버: 메인 에이전트가 자식 에이전트를 호출할 때 기본적으로 모든 기록이 전달되지 않고, 필요한 지침과 최소한의 컨텍스트만 전달됩니다. • 내러티브 캐스팅: 에이전트를 전환할 때 시스템은 이전 에이전트의 "보조 메시지"를 "내러티브 맥락"(예: "[맥락 정보]: 에이전트 A가 방금 말했습니다...")으로 변환합니다. 이를 통해 새 에이전트가 이전 작업을 수행했다고 착각하는 것을 방지하여 인지적 혼란을 피할 수 있습니다. 이 글의 핵심 주장은 프로덕션 등급 AI 에이전트를 개발하려면 단순히 '토큰 스태킹'에만 의존할 수 없으며, 효율적인 컨텍스트 라이프사이클 관리 시스템을 구축해야 한다는 것입니다. 컨텍스트를 동적으로 컴파일되고 계층화되고 주문형으로 로드되는 시스템으로 보면 개발자는 스마트하고(충분한 정보 제공) 효율적(낮은 지연 시간, 낮은 비용)인 지능형 에이전트 애플리케이션을 구축할 수 있습니다. 원본 텍스트를 읽어보세요

meng shao(@shao__meng)의 스레드

작성자 정보

스레드 내용