“GPT-5.1-Codex-Max trabaja en tareas durante más de 24 horas.” Cuando los laboratorios de IA de vanguardia hacen afirmaciones como esta, ¿podría compartir cuál fue realmente la tarea y qué produjo el modelo? Porque mi becario perezoso también puede trabajar sin parar durante 24 horas y entregar 10 líneas de código.
Vale, esta es una métrica interesante: “El 95% de los ingenieros de OpenAI utilizan Codex semanalmente, y estos ingenieros envían aproximadamente un 70% más de solicitudes de extracción desde que adoptaron Codex.” ¿Por qué el 5% restante de ingenieros no utiliza Codex?

