«Se o aprendizado por reforço (RL) é importante, devemos projetar arquiteturas neurais e pré-treinamento levando o RL em consideração desde o início.»
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.