X (Twitter)

A nova versão do Gemini Deep Research alcançou desempenho de destaque em diversos benchmarks de tarefas de pesquisa: Obtive uma pontuação de 46,4%, um resultado de alto nível, no Exame de Última Avaliação da Humanidade (HLE - Conhecimento e Raciocínio Integrados). Teve um desempenho excepcional no DeepSearchQA (Pesquisa Web em Múltiplas Etapas), alcançando 66,1%. Também teve um desempenho excepcional no BrowseComp (tarefa de navegação e comparação), atingindo 59,2%. Todas essas são conquistas de última geração.

O Google acredita que os grandes modelos de linguagem estão evoluindo de "ferramxiaohu.ai/c/xiaohu-ai/go…to pontuais" para "sistemas inteligentes capazes de executar tarefas de forma sustentável". A API de Interações é a infraestrutura projetada para esse propósito. https://t.co/JKbP7fgQnh

O Google acredita que os grandes modelos de linguagem estão evoluindo de "ferramentas de geração de texto pontuais" para

Thread de 小互 (@imxiaohu)

Informações do autor

Conteúdo da thread