Você pode reconstruir isso se analisar minhas ideias/apoios informais de benchmarks em 2024-2025. Última dica: não se trata de mais uma bobagem de "raciocínio rígido" de stemcel que desmorona diante de um GRPO otimizado. Mas já estou a pisar numa linha ténue aqui.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
