X (Twitter)

"단순화된 툴셋"을 통해 GitHub Copilot이 더욱 스마트해지는 방법 개발자들이 흔히 겪는 어려움은 도구가 너무 많으면 응답 시간이 느려지고 의사 결정이 비효율적으로 이루어진다는 것입니다. Github Copilot 에이전트는 "가상 도구", 내장형 가이드 라우팅, 적응형 클러스터링과 같은 혁신 기술을 도입하여 강력한 기능을 유지하면서도 속도와 정확도를 크게 향상시킬 수 있습니다. 핵심 개념: 적을수록 좋다. 지능형 에이전트는 정교한 도구가 필요하다. GitHub Copilot Chat은 개발자가 버그 수정이나 코드 병합과 같은 작업을 완료하는 데 도움을 주기 위해 수백 개의 도구(예: 코드베이스 분석 및 Azure 서비스 호출)를 활용합니다. 이러한 도구는 MCP를 통해 접근하지만, 문제는 도구가 너무 많으면 마치 뇌가 관련 없는 정보에 압도당하는 것처럼 에이전트에 과부하가 걸려 추론 속도가 느려지고 오류율이 증가한다는 것입니다. SWE-Lancer 및 SWEbench-Verified와 같은 벤치마크 테스트에 따르면, 전체 도구 세트를 사용할 경우 에이전트의 작업 성공률이 실제로 2~5%p 감소하는 것으로 나타났습니다. 모델이 도구를 잘못 사용하거나 주요 지침을 무시하는 경향이 있기 때문입니다. 솔루션의 핵심은 "더 적은 도구로 더 스마트해지는 것"입니다. 단순히 기능을 줄이는 것이 아니라, 지능형 라우팅과 그룹화를 사용하여 상담원이 필요할 때만 관련 도구를 호출할 수 있도록 합니다. 이는 마치 서랍처럼 어수선한 도구 상자를 관리하는 것과 같습니다. 먼저 카탈로그를 보고, 필요한 도구를 꺼내면 맹목적으로 검색하지 않아도 됩니다. 기술 구현: 내장된 가이드와 동적 선택 업데이트는 정확하고 효율적인 도구 선택을 보장하는 두 가지 핵심 메커니즘을 도입합니다. • 임베딩 기반 도구 라우팅: 이 방법은 쿼리의 벡터 임베딩을 도구의 의미적 표현과 매칭하여 가장 관련성 높은 도구 후보를 미리 선택합니다. 이는 기존 LLM의 단계별 평가보다 훨씬 빠릅니다. 벤치마크 테스트에서 이 방법은 94.5%의 도구 사용 커버리지를 달성하여 LLM 선택의 87.5% 또는 정적 목록의 69.0%를 훨씬 능가했습니다. 예를 들어, "이 버그를 수정하고 개발 브랜치에 병합하세요"라는 쿼리의 경우, 시스템은 임베딩 공간에서 "병합 도구"를 직접 잠가 관련 없는 검색 또는 문서화 도구를 건너뛰고 탐색 호출을 줄입니다. • 적응형 도구 클러스터링: Copilot 내부 임베딩 모델을 기반으로 코사인 유사도를 사용하여 유사한 도구를 자동으로 그룹화하여 "가상 도구"를 형성합니다. 이러한 가상 도구는 카탈로그처럼 전체 목록이 아닌 개요를 제공합니다. 클러스터링 후, 작은 모델이 각 그룹에 대한 요약을 생성하여 캐싱 및 빠른 액세스를 용이하게 합니다. 이 블로그는 GitHub MCP 도구의 임베딩 다이어그램을 보여줍니다. create_pending_pull_request_review 및 get_issue_comments와 같은 도구는 자연스럽게 클러스터링됩니다. 또한, GitHub은 기본 내장 도구 40개를 저장소 파싱, 파일 편집, 검색, 터미널 작업을 포함하는 13개의 핵심 도구로 간소화했으며, 나머지 비핵심 도구는 Jupyter Notebook 도구, 네트워크 상호작용 도구, VS Code 작업 공간 도구, 테스트 도구의 네 가지 가상 범주로 분류했습니다. 이러한 "무손실 동적 선택"을 통해 기능적 무결성을 보장하는 동시에 첫 번째 토큰 시간을 190밀리초 단축하고 궁극적으로 평균 응답 지연 시간을 400밀리초 단축했습니다. 이점: 더 빠르고 정확한 사용자 경험; 성능 향상: 온라인 A/B 테스트 결과 작업 성공률이 2~5% 포인트 증가하고 도구 적용 범위가 27.5% 증가했습니다. 지능형 에이전트는 추론에 더욱 집중하여 캐시 누락 및 API 할당량 문제를 줄일 수 있습니다. • 효율성 최적화: 운영 비용이 절감되고(캐시 임베딩 및 다이제스트 비용이 저렴해짐) 개발자는 더욱 원활한 상호 작용을 경험할 수 있습니다. "로딩" 루프를 기다릴 필요가 없습니다. • 실제 사례: 복잡한 쿼리를 처리할 때 시스템은 과거 맥락에서 의도를 추론할 수 있으므로 툴킷을 하나하나 확인할 필요가 없고 전반적인 안정성이 향상됩니다. 미래 전망: 장문맥 에이전트로의 진화. 도구 선택은 "장문맥 추론"의 전조로 여겨집니다. 미래에는 에이전트가 도구 사용 내역을 기억하고, 대화에서 의도를 추론하고, 다단계 작업을 계획하고, 심지어 대화 전반에 걸쳐 협업할 수 있게 될 것입니다. 임베딩, 메모리 메커니즘, 그리고 강화 학습을 결합한 Copilot은 잠재적으로 수천 건의 상호작용으로 확장되어 도구 사용에 대한 동적 학습을 지원할 수 있습니다. 이번 업데이트는 AI 개발 도구의 진화하는 추세를 반영합니다. "만능" 도구에서 "집중형" 도구로 변화하고 있습니다. GitHub은 데이터 기반 최적화를 통해 단순화가 타협이 아니라 더욱 강력한 인텔리전스로 가는 지름길임을 증명합니다. 블로그 주소:

meng shao(@shao__meng)의 스레드

작성자 정보

스레드 내용