O anúncio oficial do Gemini 3 foi divulgado. O LMArena alcançou a impressionante marca de 1501 pontos, liderando o ranking. Foi lançado e já está disponível; todo o conjunto de ferramentas (busca, aplicativo e API) está pronto para uso a partir de hoje. Eles até lançaram um modo Deep Think semelhante ao O1 e uma plataforma de desenvolvimento de agentes totalmente nova. Aqui está um resumo dos principais destaques desta atualização 👇 Aprimoramento épico da capacidade de raciocínio O Gemini 3 Pro é agora o modelo multimodal mais poderoso do mundo. Ele liderou o ranking do LMArena com uma pontuação de 1501. Alcançou uma pontuação de 37,5% no notoriamente difícil Teste Final da Humanidade (Humanity's Last Exam) e suas capacidades matemáticas também estabeleceram um novo recorde no MathArena. Seja interpretando gráficos complexos ou resolvendo problemas matemáticos desafiadores, sua profundidade e sofisticação de compreensão atingiram um novo patamar. O Google adotou um modo de processamento lento semelhante ao do O1, o Deep Think, no Gemini 3. O Deep Think dedica mais tempo ao raciocínio, abordando especificamente problemas complexos que exigem análises minuciosas. Os dados de teste mostram que ele tem um desempenho significativamente melhor do que a versão Pro, mas está sendo usado prioritariamente por testadores de segurança; os usuários do Ultra terão que esperar mais algumas semanas. Uma Nova Era no Desenvolvimento de Agentes: Antigravidade Para os desenvolvedores, o avanço mais significativo provavelmente é a nova plataforma Google Antigravity. O Gemini 3 apresenta melhorias substanciais na geração de código e no planejamento a longo prazo, atingindo uma pontuação de 76,2% no SWE-bench. O Antigravity transforma a IA em uma verdadeira parceira, capaz de planejar, escrever código e até mesmo possuir permissões de editor e terminal, controlando o navegador para verificar a execução do código — uma experiência verdadeiramente completa. Fusão de memória e multimodalidade O Gemini 3 ainda utiliza uma janela de contexto de 1 milhão de tokens, mas processa informações de uma gama mais ampla de dimensões. Por exemplo, você pode enviar uma foto de uma receita antiga escrita à mão e ele pode organizá-la em uma versão eletrônica; ou você pode enviar um vídeo de uma partida de pickleball e ele pode analisar seus movimentos e criar um plano de treinamento. Não se trata mais apenas de ler texto, mas de realmente "compreender a cena".
O Google parece estar com pressa em relação ao cronograma de lançamento do Gemini 3, mas também está levando isso muito a sério. Primeiro, há a questão da velocidade de implementação. No passado, tudo girava em torno da publicação de artigos e da ostentação; agora, o foco é o lançamento imediato, em toda a linha de produtos, incluindo busca, aplicativos, AI Studio e Vertex AI. Esse tipo de execução é o que o Google deveria ser. Em segundo lugar, temos o Antigravity. O nome é bastante interessante — "antigravidade" — e parece ter como objetivo romper com as limitações do desenvolvimento tradicional. O Agente não é mais uma simples caixa de diálogo, mas uma entidade independente com permissões de editor e terminal; este é o futuro da programação de IA. Finalmente, a batalha por modelos em larga escala entrou em uma fase prática. A diferença nas capacidades dos modelos está diminuindo; agora a competição gira em torno de quem consegue integrar essas capacidades em produtos mais rapidamente e torná-los utilizáveis para pessoas comuns. A combinação de "busca + aplicativo + nuvem" do Google pressionou a OpenAI.
