Todo mundo reclamou que o lançamento do GPT 5.1 ontem não tinha benchmarks. Agora vocês os têm. Observem pequenas regressões no AIME e no Taubench, o que aumenta a confiança de que isso não é manipulação de benchmarks. Acho que, de forma mais geral, a comunicação sobre modelos para um laboratório de IA voltado para o consumidor precisa ser dividida em duas: uma para o público em geral e outra para os especialistas. Uma para quem gosta de novidades e outra para quem gosta de detalhes técnicos. A grande questão é se a "Inteligência Artificial Geral" (IAG) deveria ter um "modelo único para todos". Até o GPT-5, a resposta era sim. Agora, parece que sempre teremos cinco tipos normais e cinco tipos de código. A postagem de @fidjissimo sugere o mesmo, embora em nível de produto.
openai.com/index/gpt-5-1-… cookbook.openai.com/examples/gpt-5… cookbook.openai.com/examples/build… Estes são todos os links das platplatform.openai.com/docs/guides/la…3platform.openai.com/docs/pricingiplatform.openai.com/docs/models/Gp…gplatform.openai.com/docs/models/Gp…hplatform.openai.com/docs/models/Gp…gplatform.openai.com/docs/models/Gp…qcookbook.openai.com/examples/gpt-5…vTxHIgsQa https://t.co/pnsRaFR5oA https://t.co/RtimCXf3AC https://t.co/0gWnxVtryk https://t.co/uPkxFwfgr9
