A nova versão do Gemini Deep Research alcançou desempenho de destaque em diversos benchmarks de tarefas de pesquisa: Obtive uma pontuação de 46,4%, um resultado de alto nível, no Exame de Última Avaliação da Humanidade (HLE - Conhecimento e Raciocínio Integrados). Teve um desempenho excepcional no DeepSearchQA (Pesquisa Web em Múltiplas Etapas), alcançando 66,1%. Também teve um desempenho excepcional no BrowseComp (tarefa de navegação e comparação), atingindo 59,2%. Todas essas são conquistas de última geração.
O Google acredita que os grandes modelos de linguagem estão evoluindo de "ferramxiaohu.ai/c/xiaohu-ai/go…to pontuais" para "sistemas inteligentes capazes de executar tarefas de forma sustentável". A API de Interações é a infraestrutura projetada para esse propósito. https://t.co/JKbP7fgQnh

