RT @maksym_andr: Lançamos o PostTrainBench: um benchmark que mede o desempenho de agentes de IA como o Claude Code no pós-treinamento de LLMs básicos. Esperamos…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.