LOL, o GPT-5.2 acabou de ser lançado e já está sofrendo um ataque surpresa. O evento de lançamento do GPT-5.2 apresentou um caso demonstrando as marcações de identificação de componentes e interfaces em uma placa-mãe de computador para destacar seu poder. No entanto, o engenheiro do Google DeepMind, @bcaine, executou o mesmo caso diretamente com o Gemini-3.0-pro e obteve um desempenho muito superior. Reproduzi o resultado usando o método dele e funcionou perfeitamente. A imagem mostra minha reprodução. Como você pode ver, as marcações do Gemini-3.0-pro são extremamente precisas. Este caso do GPT-5.2, por outro lado, provavelmente foi selecionado após várias execuções... O método específico é o seguinte: Primeiro, envie o grafo GPT-5.2 para o nano-banana-pro para remover as caixas de rótulos. Em seguida, envie o grafo sem rótulos de volta para o gemini-3.0-pro. O comando é o seguinte: Preciso de ajuda para usar coordenadas entre [0, 1000] para rotular as caixas delimitadoras visuais de todos os componentes e interfaces na imagem e, em seguida, usar um script em Python para exibir essas caixas delimitadoras na imagem. Use caixas de cores diferentes para rotular os diferentes tipos de componentes e interfaces. Seja detalhado, como em um manual do usuário. (Lembre-se de ativar a ferramenta de execução de código) Estes são os links que eu utilizei: https://t.co/KOoWrQvQrg, https://t.co/fCKDtdYzmr Postagem original:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.



