De acordo com um vazamento da conta TestingCatalog do Google: o Google adicionou um modo de "pesquisa automática" multiagente ao Gemini Enterprise. (https://t.co/aBhEeNzIge) O Google está desenvolvendo um sistema multiagente no Gemini para Empresas. Você fornece um tópico e um conjunto de critérios de avaliação, e ele pode gerar diversas ideias por conta própria. Em seguida, ele pode reunir uma equipe inteira de agentes e revisar essas ideias rodada após rodada, como em um torneio. Este sistema pode funcionar continuamente por cerca de 40 minutos. Para um produto destinado a usuários corporativos comuns, este é um processo de inferência contínua muito longo. Ao final desses 40 minutos, os usuários receberão uma longa lista de ideias, classificadas da melhor para a pior de acordo com os critérios definidos inicialmente. A escala é bastante ampla: o sistema pode gerar aproximadamente 100 ideias por vez. Para cada ideia, você receberá: - Uma visão geral - Uma explicação mais detalhada - Um resumo da avaliação - Uma análise completa e detalhada - E um "relatório de desempenho no torneio" específico. Este "Relatório de Desempenho" é um arquivo separado que você pode abrir e analisar quando quiser. Todas as ideias geradas são selecionáveis; você pode clicar em qualquer uma para explorá-las mais a fundo. Na versão beta atual, o Google parece ter criado três agentes, dois dos quais são construídos sobre esse sistema de "torneio" multiagente. A primeira se chama "Geração de Ideias". Nesse modo, basta fornecer um tópico, e o agente iniciará um fluxo de trabalho multiagente completo, usando uma "avaliação em estilo torneio" para gerar e classificar várias ideias relevantes. (A chamada avaliação em estilo torneio significa que as soluções estão constantemente "competindo" entre si, com as vencedoras permanecendo e as mais fracas sendo eliminadas.) O segundo é chamado de "Co-cientista". Esta opção é mais voltada para cenários de pesquisa e desenvolvimento científico. Você pode especificar um tópico de pesquisa, fornecer alguns dados adicionais e, em seguida, uma equipe inteira de agentes inteligentes irá gerar direcionamentos e planos de pesquisa e, posteriormente, usar o mesmo mecanismo de torneio para avaliar essas ideias, só que desta vez com ênfase nas necessidades da pesquisa e exploração científica. O ponto mais interessante aqui é o poder computacional incrivelmente alto investido nisso. Permitir que um agente trabalhe continuamente em uma tarefa por cerca de 40 minutos é considerado uma "configuração de luxo" na maioria das ferramentas de agentes atuais. Ao longo dos 40 minutos, o sistema itera continuamente sobre o problema, gerando, filtrando, pontuando e reorganizando-o constantemente. Atualmente, tudo isso existe apenas dentro do Gemini for Enterprise, está em fase de desenvolvimento interno, oculto para usuários comuns e ainda não foi lançado ao público como um recurso oficial. Em comparação com as implementações de agentes existentes, isso parece ser um avanço significativo. Mesmo agentes avançados que já possuem funcionalidades semelhantes às de navegadores geralmente são limitados por janelas de contexto e orçamentos de tempo. Desta vez, a abordagem do Google é disponibilizar diretamente uma grande quantidade de poder computacional para uso por clientes corporativos, criando uma interface de produto legítima. Isso se alinha perfeitamente com o conceito de "IA de Nível 3": esse nível de agente de IA é descrito como capaz de trabalhar continuamente no mesmo problema por um período considerável de tempo. (Nível 3 aqui não é um padrão unificado, mas sim um termo informal da indústria para "agentes capazes de trabalhar continuamente por longos períodos de tempo".) Dessa perspectiva, ter um agente executando uma única tarefa por 40 minutos é um exemplo muito típico, até mesmo um tanto radical. Na prática, o principal resultado desse sistema é um "conjunto de ideias bem filtradas e refinadas". Mas essas ideias são muito mais do que uma simples coleção aleatória de sugestões; elas podem ser vistas como um conjunto estruturado de direcionamentos de pesquisa: considerando seus dados e o contexto do problema, esses direcionamentos têm o potencial de gerar insights realmente valiosos. Portanto, o aprimoramento dessa poderosa funcionalidade de agente pelo Google, voltada especificamente para organizações, empresas e equipes de pesquisa, é por si só bastante intrigante. Quando esse recurso for finalmente lançado ao público, poderá representar um grande avanço, especialmente se esses agentes forem, em última análise, executados no Gemini 3 Pro. Atualmente, o Gemini 3 Pro ainda não está disponível no Gemini Enterprise, portanto, não está claro qual modelo está sendo usado por trás desses agentes experimentais. Ainda há muito a testar e verificar. Quando você envia uma solicitação ao sistema, ele primeiro fornece um resumo do "planejamento": as dimensões a serem avaliadas e as direções a partir das quais as ideias serão geradas e filtradas. Somente após a sua confirmação, o sistema inicia a "tarefa principal". Isso equivale a alinhar com você "como exatamente pretendo entender o seu problema" antes de consumir uma grande quantidade de poder computacional. Além do fluxo de trabalho de torneio multiagente, o Gemini Enterprise possui outro agente chamado "bate-papo com seus documentos", que tem sua própria interface de usuário dedicada. Esse agente permite que os usuários carreguem PDFs de até 30 MB e, em seguida, participem de conversas específicas com esses documentos. Essa funcionalidade também faz parte do Gemini Enterprise, mas ainda não foi lançada ao público e não está disponível em ambientes de produção. Sua filosofia de design é analisar e inserir conteúdo de PDFs de até 30 MB no contexto do modelo, permitindo que os usuários extraiam informações mais valiosas de documentos existentes, em vez de dependerem exclusivamente da folheação manual de páginas. Muitas outras funcionalidades estão em desenvolvimento no Gemini Enterprise, mas estas duas linhas são realmente as que mais chamam a atenção: 1. Fluxo de trabalho multiagente no estilo torneio 2. Agentes inteligentes especializados orientados a documentos Em particular, a arquitetura multiagente baseada em torneios parece ser uma abordagem de produto inovadora — outros provedores de serviços de Modelo de Linguagem Amplo (LLM) não parecem oferecer nada semelhante nesse nível. Torneios multiagentes ainda são muito raros em ferramentas para usuários finais. Talvez o Grok Heavy possa ser usado como comparação, mas é improvável que siga exatamente a mesma direção da abordagem do Google. Uma vez que esses agentes estejam mais maduros, seria inestimável contar com um sistema formal de avaliação e testes comparativos. Mesmo com base na descrição atual, o agente Co-cientista já é suficiente para entusiasmar muitas grandes organizações e equipes de pesquisa — especialmente aquelas que exploram novas direções científicas. Quanto ao lançamento oficial desses agentes inteligentes, ou se eles serão disponibilizados para usuários não corporativos, tudo isso ainda é desconhecido. fonte:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.