X (Twitter)

O Gemini 3 do Google foi lançado tarde da noite, ostentando capacidades incomparáveis em programação, uso de ferramentas e compreensão multimodal, inaugurando a era Gemini 3! Codificação de Vibração Uma única frase em linguagem natural pode gerar um aplicativo totalmente interativo, alcançando o primeiro lugar no ranking do WebDev Arena, na posição 1487. Codificação Agêntica O Terminal-Bench 2.0 obteve uma pontuação de 54,2%, com suporte para reconstrução entre arquivos, depuração de contexto extenso e implementação de recursos. Eles também desenvolveram uma plataforma inteligente para desenvolvimento de agentes: o Google Antigravity, que pode agendar vários agentes inteligentes em paralelo para concluir tarefas complexas de software, incluindo planejamento, escrita de código e verificação de abertura de navegador. Vários agentes podem ser executados simultaneamente. A compreensão multimodal estabelece novos recordes em benchmarks complexos de inferência de grafos/vídeos, como MMMU-Pro e Video-MMMU, suportando contextos longos com 1 milhão de tokens. Os novos recursos incluem fidelidade visual ajustável e capacidades de compreensão de documentos que superam o OCR tradicional, permitindo raciocínio complexo, compreensão espacial/de tela, previsão de trajetória e outras funções. Essas capacidades podem ser aplicadas à direção autônoma, XR, robótica e outros cenários. Existe também o Gemini 3 Deep Think, que é ainda melhor que o Gemini 3 Pro. #Gêmeos3

Experaistudio.google.com/appsco/pblog.google/technology/dev…//t.co/akdHWaqmae

Experimente aqui: https://t.co/pku3xZBdsV
Blog: https://t.co/akdHWaqmae

Thread de AIGCLINK (@aigclink)

Informações do autor

Conteúdo da thread