Minha história de programação intuitiva: Claude Code vs Codex CLI. Para a próxima demonstração, pedi ao Claude Code (Sonnet 4.5) para gerar 4 operações CRUD simples, em um único prompt, porque achei que seriam "fáceis e padrão". 1. Funcionou por 10 minutos e gerou código *sem testes automatizados*, embora eu exija especificamente testes no arquivo de diretrizes CLAUDE(dot)md. 2. Pedi para gerar os testes, o que aconteceu em 3 minutos, mas ao executar `php artisan test`, encontrei muitos problemas e fiquei dando voltas em círculos tentando corrigi-los. 3. Após mais 10 minutos, retornou "não, tivemos falhas, mas tudo bem, aqui está o resultado". 4. Solicitei ao Codex (GPT-5.1-Codex) que corrigisse os testes. Funcionou por 15 minutos, lentamente, mas funcionou. Todos os testes passaram. Principais conclusões: 1. Não atribua um escopo de trabalho muito amplo para Sonnet. Ou, na verdade, para qualquer mestrado em Direito. 2. O Codex com GPT-5.1 é mais lento, mas muito mais completo que o Sonnet. Provavelmente o Opus 4.5 teria tido um desempenho melhor, mas seria mais caro. Tentarei na próxima vez que tiver uma tarefa semelhante.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
