AI에 "근육 기억"을 부여하는 것: 에이전트는 어떻게 실시간으로 학습하고 "상태 색인 경험"을 통해 더욱 똑똑해질 수 있을까? 주요 문제점: AI 에이전트의 "기억상실" 현재의 AI 에이전트는 지능적이지만 일반적으로 치명적인 결함이 있습니다. 즉, 배포 후에는 학습할 수 없습니다. • 모델은 "죽었다": 모델이 훈련되고 배포되면 해당 지식은 고정된다. • 실수로부터 배우는 능력 부족: 에이전트가 오늘 복잡한 웹페이지에서 작업하지 못하면 내일 같은 웹페이지를 접했을 때 같은 실수를 할 수 있습니다. • "근육 기억" 부족: 인간은 "시행착오"(절차적 지식)를 통해 기술을 습득하는 반면, AI 에이전트는 실시간 경험을 통해 기술을 축적하는 이러한 메커니즘이 부족한 경우가 많습니다. 해결책: PRAXIS 시스템 이 문제를 해결하기 위해 저자는 PRAXIS(상태별로 색인화된 경험을 가진 에이전트를 위한 절차적 회수)라는 새로운 메커니즘을 제안했습니다. PRAXIS는 에이전트의 "실시간 오류 로그" 또는 "경험 메모"로 생각할 수 있습니다. • 기록 환경: 에이전트가 작업을 수행할 때 PRAXIS는 백그라운드에서 수행하는 모든 작업과 그 결과를 자동으로 기록합니다. • 장면 매칭: 에이전트가 유사한 장면(환경 상태 + 내부 상태)을 다시 접하게 되면 PRAXIS는 과거 경험을 빠르게 검색합니다. • 의사결정 지원: 에이전트에게 "이 화면에서 이 버튼을 클릭한 것은 지난번에 성공(또는 실패)했습니다"라고 알려 주어, 에이전트가 더 나은 선택을 할 수 있도록 직접 안내합니다. 주요 기술 포인트: 가벼운 플러그인: PRAXIS는 대형 모델을 재교육할 필요가 없습니다. 저렴한 외부 메모리 모듈과 더 비슷합니다. • 이중 인덱싱: 외부 환경(웹페이지의 모습 등)뿐만 아니라 에이전트의 내부 상태(현재 계획 등)도 살펴보므로 경험 매칭의 정확성이 보장됩니다. 실험 결과: 웹 브라우징 작업에서 놀라운 성과를 보였습니다. 연구팀은 REAL 웹 브라우징 벤치마크를 통해 결과를 평가했으며, 그 결과는 다음과 같습니다. • 더 높은 작업 완료율: PRAXIS를 갖춘 상담원은 복잡한 웹 페이지 작업을 더 정확하게 완료할 수 있습니다. • 비용 효율성 향상: 우회로를 피하고 비효율적인 시도를 줄임으로써 토큰 소비와 운영 비용이 크게 절감됩니다. • 높은 적응성: 이전에 본 적이 없는 작업의 경우, 환경이 비슷하다면 에이전트는 과거 경험을 바탕으로 유추하여 문제를 해결할 수 있습니다. 산업적 함의와 결론: 이 논문에서는 AI 에이전트가 "자체 진화"를 달성할 수 있는 저비용 경로를 제안합니다. • "일회성" 인텔리전스와 작별하세요. 미래의 에이전트는 더 이상 변하지 않는 도구가 아니라, 사용할수록 더욱 편리하고 지능적으로 변하는 보조자가 될 것입니다. • 동적 환경 처리: 특히 웹 브라우징 및 소프트웨어 작동과 같이 인터페이스가 자주 변경되는 시나리오에서 PRAXIS 메커니즘을 사용하면 모델 제조업체에서 새 버전을 출시할 때까지 기다릴 필요 없이 에이전트가 사람처럼 새 버전의 UI에 빠르게 적응할 수 있습니다. 종이
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
