A OpenAI lançou ontem a versão atualizada do seu modelo de imagens, Image 1.5. Ainda não consegue gerar caracteres chineses e certamente é inferior ao Nano Banana Pro em raciocínio complexo, conhecimento de mundo e recuperação de conhecimento em tempo real. O problema inicial com a tonalidade amarelada foi corrigido, mas a saturação agora parece um pouco acinzentada. Vamos fazer um teste simples: Primeiro, vamos analisar a semelhança facial. Aqui, a Imagem 1.5 não parece ter uma semelhança tão grande quanto a Nano Banana Pro.
Depois, há o meu desafio de criar um pôster em 3D. O idioma chinês é bastante fraco, e o estilo estético também deixa a desejar; parece brega, sem falar nos detalhes das imagens.
Transforme o tempo gasto em frente à tela em pôsteres. Em termos de estilo e detalhes, a Imagem 1.5 é louvável e muito mais rica que a Big Banana. No entanto, deixa a desejar no que diz respeito a ícones e informações de contexto. Não consegue reproduzir ícones de forma alguma e não tem ideia do que seja o software DIA.
No teste com o pôster, a geração de caracteres chineses foi razoável, especialmente considerando que havia poucos caracteres. Então, a imagem ficará muito complexa, com muito ruído sem sentido, parecendo confusa e resultando em uma experiência de visualização muito ruim e sem foco. O design da fonte carece de variedade. Ao analisar mais detalhadamente, percebe-se alguns problemas com os materiais utilizados nos itens. As duas pegas, no entanto, parecem mais realistas do que a banana grande.



