RT @shao__meng: [Novo Benchmark para Agentes de Codificação] cline-bench: a nova iniciativa de benchmark de código aberto e orientada para o mundo real, lançada pela equipe @cline, para agentes de codificação. O objetivo principal desta iniciativa é abordar dois grandes problemas no campo atual da avaliação de agentes de codificação: os benchmarks existentes (como o SWE-Bench) são muito acadêmicos, carecem de credibilidade e são facilmente influenciados por…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.