RT @ShengjieWa34067: @srush_nlp Sim, em experimentos de RL com múltiplas rodadas, na verdade vemos o pass@N aumentar com o número de etapas de treinamento. Talvez…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.