X (Twitter)

Claude Code와 비슷한 정확도로 4배 더 빠른 속도: @relace_ai의 "새로운 코드 검색 아키텍처"에 대한 심층 분석 🚀 핵심 개요: Fast Agentic Search(FAS)란 무엇인가요? FAS는 Relace의 최신 릴리스로, 코드베이스 검색 작업을 위해 특별히 설계된 소형 지능형 에이전트 모델입니다. 강화 학습을 통해 최적화되었으며, grep 및 view와 같은 도구를 병렬로 호출하여 사용자 요청과 관련된 코드 파일을 빠르게 찾을 수 있습니다. 💡 배경: RAG와 에이전트 검색의 딜레마 조각 장점: 매우 빠른 속도와 낮은 비용. • 단점: 복잡한 코드 논리에는 정확도가 충분하지 않은 경우가 많습니다. 벡터 유사성에 의존하고, 추론 능력이 부족하며, 핵심 맥락을 놓치는 경우가 많습니다. 에이전트 검색 • 장점: 매우 정확합니다. 이 모델은 인간 프로그래머처럼 작동하여 단계별 추론을 통해 코드를 찾고, 파일을 검토하고, 참조로 바로 이동합니다. • 단점: 속도가 느리고 비용이 많이 듭니다. 일반적으로 "직렬" 작업(생각 -> 파일 검색 -> 다시 생각 -> 다음 파일 검색)이 필요하므로 지연 시간이 길어집니다. FAS의 진입점: 에이전트 검색의 추론 깊이와 RAG의 응답 속도라는 두 가지 장점을 결합하려고 시도했습니다. 🛠️ 기술적 설명: FAS는 어떻게 이를 달성하나요? FAS의 성공은 주로 세 가지 핵심 기술 전략에 달려 있습니다. 1. 병렬 도구 호출 "한 번에 하나의 파일만 검색"하는 일반적인 지능형 에이전트와 달리, FAS는 여러 명령을 동시에 실행하도록 훈련되었습니다. 예를 들어, 4~12개의 서로 다른 파일 경로를 확인하거나 여러 검색 명령을 동시에 실행할 수 있습니다. 이를 통해 여러 차례 대화가 반복되는 상황에서 발생하는 네트워크 지연 시간을 크게 줄일 수 있습니다. 2. 전담 강화 학습(정책 기반 강화 학습) 팀은 일반적인 지도식 미세 조정(SFT)만을 사용하는 대신 강화 학습 환경을 구축했습니다. • 보상 기능: 특별한 보상 공식이 설계되었습니다. "정확한 타겟팅"(높은 재현율과 정밀도)에는 보상을 제공하고, "느린 행동"(검색 라운드가 너무 많으면 점수가 감소)에는 페널티를 부여합니다. 창발적 추론 능력: 훈련 후반 단계에서 모델은 대규모 병렬 탐색을 수행하기 전에 추론 단계를 수행하는 전략을 "학습"했습니다. 이는 모델이 맹목적으로 추측하는 것이 아니라 논리적인 방식으로 동시에 작동한다는 것을 증명합니다. 3. 작업 분리(서브에이전트 아키텍처) 이 기사의 데이터 분석 결과, 실제 프로그래밍 작업에서는 토큰의 약 60%가 "코드 찾기" 단계에서 소모되는 것으로 나타났습니다. 따라서 "검색"을 주 에이전트로부터 분리하여 전담 소형 모델 FAS에 맡기면 주 모델의 값비싼 토큰을 절약할 수 있고, 관련 없는 맥락이 주 모델의 판단을 방해하는 것을 방지할 수 있습니다. 📊 실제 테스트 결과: 속도와 정확도: 동일한 정확도에서 FAS는 기존 직렬 에이전트 검색보다 4배 더 빠릅니다. • SWE-벤치 테스트: FAS를 코딩된 에이전트에 통합한 후 중간 지연 시간이 9.3% 감소했고 토큰 소비가 13.6% 감소했습니다. • 참고: 실제 복잡한 개발 시나리오(명확히 정의된 벤치마크와 비교)에서는 검색 비중이 더 높기 때문에 성능 향상이 더 클 것으로 예상됩니다. 📝 요약 및 통찰력 이 글은 단순히 새로운 기능의 출시에 관한 것이 아닙니다. AI 에이전트 개발의 중요한 추세, 즉 "전반적인 대형 모델"에서 "전문가 하위 모델 협업"으로의 전환을 보여줍니다. 전문화된 강화학습으로 학습된 작은 모델을 사용하여 단일 "검색" 단계를 최적화함으로써, 더 낮은 비용과 더 빠른 속도로 값비싼 대형 모델의 전반적인 성능을 달성하거나 심지어 능가할 수 있습니다. 이는 향후 더욱 효율적인 AI 프로그래밍 어시스턴트를 구축하는 명확한 방향을 제시합니다.

meng shao(@shao__meng)의 스레드

작성자 정보

스레드 내용