Resumo do relatório de degradação do Codex: A investigação não identificou uma única causa raiz; em vez disso, constatou-se uma combinação de mudanças de comportamento e pequenos erros, com várias correções já implementadas e outras a caminho. - O hardware mais antigo apresentou desempenho inferior nas avaliações e foi removido, e um balanceamento de carga aprimorado está sendo implementado para reduzir a latência. - A compactação passou a ser usada com mais frequência, e compactações repetidas prejudicaram a precisão; resumos recursivos foram bloqueados e um aviso foi adicionado para manter os chats focados. - O fluxo `apply_patch` pode excluir e recriar arquivos após falhas em comparações, o que é arriscado se interrompido; medidas de mitigação estão em andamento e uma correção de modelo a longo prazo está planejada. - Não houve regressão de latência em toda a frota, mas algumas sessões apresentaram aumento ineficiente de tentativas e tempos limite; o tratamento de tarefas interativas e de longa duração está sendo aprimorado. - Um bug de amostragem restrita produziu tokens fora da distribuição, incluindo mudanças ocasionais de idioma no meio da frase em menos de 0,25% das sessões; uma correção está sendo implementada. - A API de Respostas adicionou novas linhas extras em torno das definições de ferramentas; isso não teve impacto mensurável no desempenho. - As avaliações mostram que a CLI 0.45 manteve a qualidade enquanto reduzia os tokens em aproximadamente 10%; nem a opção `--search` nem as alterações recentes no prompt causaram regressões. - A análise de infraestrutura revelou baixas taxas de acerto no cache de autenticação, adicionando cerca de 50 ms à latência final; as taxas de erro no diretório de trabalho permaneceram inalteradas. A recomendação é priorizar ferramentas minimalistas e conversas mais curtas e objetivas, e uma equipe dedicada à avaliação de desempenho no mundo real está sendo formada e contratando profissionais.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.