Resumen del informe sobre la degradación del Codex: La investigación no halló una única causa raíz; más bien una combinación de cambios de comportamiento y pequeños errores, con varias correcciones ya publicadas y más en camino. - El hardware antiguo tuvo un rendimiento inferior en las evaluaciones y fue retirado, y se está implementando un equilibrio de carga mejorado para reducir la latencia. - Se utilizó más a menudo la compactación, y las compactaciones repetidas perjudicaron la precisión; se bloquearon los resúmenes recursivos y se añadió una advertencia para mantener los chats centrados. - El flujo `apply_patch` podría eliminar y luego volver a crear archivos después de que las diferencias fallaran, lo cual es arriesgado si se interrumpe; se están realizando mitigaciones y se planea una corrección del modelo a largo plazo. - No se produjo una regresión de latencia en toda la flota, pero algunas sesiones aumentaron los reintentos y los tiempos de espera de manera ineficiente; se está mejorando el manejo de tareas interactivas y de larga duración. - Un error de muestreo restringido produjo tokens fuera de distribución, incluidos cambios de idioma ocasionales en medio de las oraciones en menos del 0,25 % de las sesiones; se está implementando una solución. - La API de respuestas agregó saltos de línea adicionales alrededor de las definiciones de herramientas; esto no tuvo un impacto medible en el rendimiento. - Las evaluaciones muestran que CLI 0.45 mantuvo la calidad al tiempo que redujo los tokens en aproximadamente un 10%; ni `--search` ni los cambios recientes en el prompt causaron regresiones. - El análisis de la infraestructura encontró bajas tasas de aciertos en la caché de autenticación, lo que añadió unos 50 ms a la latencia de cola; las tasas de error del directorio de trabajo no sufrieron cambios. - La recomendación es priorizar las herramientas minimalistas y las conversaciones más breves y específicas; además, se está formando y contratando un equipo especializado en rendimiento en el mundo real.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.