RT @xiangyue96: Existem opiniões divergentes sobre se o RL pode realmente melhorar o desempenho do modelo base (por exemplo, pass@128). A resposta é: ambas…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.