Modelos mais leves exigem menos poder computacional e, portanto, obtêm ganhos desproporcionais do aprendizado por reforço (mais iterações/feedback para um determinado cálculo de entrada). Essa inversão parece crucial.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.