X 계정 TestingCatalog에서 유출된 정보에 따르면, Google은 Gemini Enterprise에 다중 에이전트 "자동 조사" 모드를 추가했습니다. (https://t.co/aBhEeNzIge) Google은 Gemini for Enterprise에서 다중 에이전트 시스템을 구축하고 있습니다. 주제와 평가 기준을 제공하면 시스템이 스스로 수많은 아이디어를 도출해 냅니다. 그런 다음 전체 에이전트 팀을 구성하여 마치 토너먼트를 진행하듯이 라운드를 진행하며 이러한 아이디어들을 검토합니다. 이 시스템은 한 번에 약 40분 동안 연속 작동할 수 있습니다. 일반 기업 사용자를 대상으로 하는 제품으로서는 매우 긴 연속 추론 프로세스입니다. 40분이 지나면 사용자는 처음에 설정한 기준에 따라 최고부터 최악까지 순위가 매겨진 긴 아이디어 목록을 받게 됩니다. 규모는 상당히 커서 시스템은 한 번에 약 100개의 아이디어를 생성할 수 있습니다. 각 아이디어에 대해 다음과 같은 정보를 받게 됩니다. - 개요 - 더 자세한 설명 - 리뷰 요약 - 완전한 긴 리뷰 - 그리고 전담 "대회 성과 보고서"도 있습니다. 이 "성과 보고서"는 별도의 출력물로, 언제든지 열어서 검토할 수 있습니다. 생성된 모든 아이디어는 선택 가능하며, 원하는 아이디어를 클릭하면 더 자세히 살펴볼 수 있습니다. 현재 베타 버전에서 Google은 세 개의 에이전트를 구축한 것으로 보이며, 그 중 두 개는 이 다중 에이전트 "토너먼트" 시스템 위에 구축되었습니다. 첫 번째는 "아이디어 생성"이라고 합니다. 이 모드에서는 주제만 제공하면 에이전트가 "토너먼트 방식 평가"를 통해 다양한 관련 아이디어를 생성하고 순위를 매기는 완전한 다중 에이전트 워크플로를 시작합니다. (소위 토너먼트 방식 평가는 솔루션들이 끊임없이 서로 "경쟁"하며, 승자는 남고 약자는 탈락하는 것을 의미합니다.) 두 번째는 "공동 과학자"라고 합니다. 이 방식은 과학 연구 및 개발 시나리오에 더욱 중점을 두고 있습니다. 연구 주제를 지정하고 추가 데이터를 제공하면 지능형 에이전트 팀이 먼저 연구 방향과 계획을 수립하고, 동일한 토너먼트 메커니즘을 사용하여 이러한 아이디어를 평가합니다. 다만 이번에는 과학 연구 및 탐사의 필요성에 중점을 둘 것입니다. 여기서 가장 흥미로운 점은 여기에 투자된 엄청나게 높은 컴퓨팅 파워입니다. 상담원이 약 40분 동안 작업을 계속 수행할 수 있도록 하는 것은 대부분의 현재 상담원 도구에서 "고급 구성"으로 간주됩니다. 40분 동안 시스템은 문제를 지속적으로 반복하며, 문제를 생성하고, 필터링하고, 점수를 매기고, 재구성합니다. 현재 이 모든 기능은 Gemini for Enterprise에서만 제공되며, 내부 개발 단계에 있고, 일반 사용자에게는 공개되지 않았으며, 아직 공식 기능으로 출시되지 않았습니다. 기존 에이전트 구현과 비교했을 때 이는 상당한 진전으로 보입니다. 이미 브라우저와 유사한 기능을 갖춘 고급 에이전트조차도 일반적으로 컨텍스트 창과 시간 예산에 제약을 받습니다. 이번에 구글의 접근 방식은 기업 고객이 사용할 수 있도록 "대량의 컴퓨팅 파워를 테이블 위에 직접 올려놓음"으로써 합법적인 프런트엔드 제품 인터페이스를 구축하는 것입니다. 이는 "레벨 3 AI"라는 개념과 완벽하게 부합합니다. 이 레벨의 AI 에이전트는 상당 시간 동안 동일한 문제를 지속적으로 처리할 수 있는 것으로 설명됩니다. (여기서 레벨 3은 통일된 표준이 아니라 "장시간 지속적으로 작업할 수 있는 에이전트"를 뜻하는 비공식적인 업계 용어입니다.) 이러한 관점에서 볼 때, 에이전트가 단일 작업을 40분 동안 수행하는 것은 매우 전형적이고, 심지어 다소 급진적인 사례입니다. 실제 사용에서 이 시스템의 핵심 출력은 "잘 걸러지고 정제된 아이디어 집합"입니다. 하지만 이는 단순한 무작위적인 제안들의 집합을 훨씬 넘어, 구조화된 연구 방향의 집합으로 볼 수 있습니다. 데이터와 문제 맥락을 고려할 때, 이러한 방향은 진정으로 가치 있는 인사이트로 이어질 수 있는 잠재력을 가지고 있습니다. 따라서 구글이 조직, 기업, 그리고 연구팀을 위해 이처럼 매우 강력한 에이전트 기능을 발전시킨 것은 그 자체로 매우 흥미롭습니다. 이 기능이 마침내 대중에 공개되면, 특히 이 에이전트들이 Gemini 3 Pro를 기반으로 구동된다면 상당한 진전이 있을 수 있습니다. 현재 Gemini 3 Pro는 Gemini Enterprise에서 아직 제공되지 않으므로, 이 실험적 에이전트에 어떤 모델이 사용되는지는 불분명합니다. 아직 테스트하고 검증해야 할 부분이 많습니다. 시스템에 프롬프트를 제출하면 먼저 "계획된 내용"에 대한 요약이 제공됩니다. 평가할 차원과 아이디어가 생성되고 필터링될 방향이 요약되어 있습니다. 이 요약을 확인한 후에야 시스템이 실제로 "중요 작업"을 시작합니다. 이는 막대한 컴퓨팅 파워를 소모하기 전에 "문제를 정확히 어떻게 이해할 것인지"에 대해 사용자와 협의하는 것과 같습니다. Gemini Enterprise는 멀티 에이전트 토너먼트 워크플로 외에도 "문서와 채팅"이라는 전용 UI를 갖춘 에이전트를 제공합니다. 이 에이전트를 통해 사용자는 최대 30MB 크기의 PDF 파일을 업로드하고 해당 문서와 전용 대화를 나눌 수 있습니다. 이 기능 역시 Gemini Enterprise에 포함되어 있지만, 아직 공개되지 않았으며 현재 프로덕션 환경에서는 사용할 수 없습니다. 최대 30MB의 PDF 콘텐츠를 분석하여 모델의 컨텍스트에 저장할 수 있도록 설계되었으며, 이를 통해 사용자는 수동으로 페이지를 넘기는 데만 의존하지 않고 기존 문서에서 더욱 가치 있는 정보를 추출할 수 있습니다. Gemini Enterprise에서는 다른 많은 기능도 개발 중이지만, 이 두 가지 라인이 가장 눈길을 끕니다. 1. 멀티 에이전트 토너먼트 스타일 워크플로 2. 문서 중심의 전문화된 지능형 에이전트 특히 토너먼트 기반 다중 에이전트 아키텍처는 획기적인 제품 접근 방식으로 보입니다. 다른 대규모 언어 모델(LLM) 서비스 제공업체들은 이 수준에서 유사한 기능을 제공하지 않는 것 같습니다. 다중 에이전트 토너먼트는 최종 사용자 도구에서 여전히 매우 드뭅니다. Grok Heavy를 비교 대상으로 사용할 수는 있겠지만, Google의 접근 방식과 완전히 동일한 방향성을 가질 가능성은 낮습니다. 이러한 에이전트들이 성숙되면 공식적인 평가 시스템과 벤치마크 테스트가 구축되는 것이 매우 중요할 것입니다. 현재의 설명만으로도 공동 과학자 에이전트는 이미 많은 대규모 기관과 연구팀, 특히 새로운 과학 방향을 모색하는 연구팀에게 큰 기대를 걸기에 충분합니다. 이러한 지능형 에이전트가 공식적으로 출시될 시점이나 기업 사용자가 아닌 일반인에게도 제공될지는 현재로서는 알 수 없습니다. 원천:
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.