RT @scaling01: Claude 4.5 Opus domina mais um benchmark de codificação O AutoCodeBench-V2 consiste em 1000 problemas selecionados e refinados iterativamente…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.