Não dê ouvidos aos pessimistas, o Gemini 3 é extremamente bom em todos os tipos de tarefas de programação. Desde interfaces de usuário para aplicativos web, desenvolvimento iOS em Swift, código backend em Python, até qualquer coisa relacionada a IA/ML, etc. É realmente robusto e eficiente em seguir regras e usar ferramentas.
Parece que sempre que um modelo inovador é lançado, um monte de gente querendo ganhar fama começa a falar mal dele, dizendo que é "decepcionante" e que não atingiu seu objetivo principal. Geralmente, a culpa é dessas pessoas, que não souberam dar dicas ou que o objetivo era idiota e completamente irrelevante para a vida real.
Existem algumas exceções, como o Llama4, que obviamente era horrível para qualquer um que o experimentasse por 3 minutos. Mas as pessoas disseram o mesmo sobre o GPT-5 e isso era ridiculamente errado. É como no mercado de ações: as pessoas ganham mais atenção por serem céticas e contrárias à corrente. A negatividade vende.
O que importa (pelo menos para programação) é a qualidade do modelo para pessoas que já são habilidosas no uso de modelos semelhantes para desenvolvimento de software, e a opinião fundamentada delas após testá-lo por várias horas em uma variedade de tarefas realistas e do mundo real, e não problemas tolos e enganosos.
E leva um bom tempo e muitos testes independentes para realmente ver o quão consistente e autônomo o modelo é, quanta capacidade de ação e "garra e determinação" ele demonstra (parte disso também depende da estrutura do agente, como Cursor versus Gemini-CLI), e o quão confiável ele é com as ferramentas.