Aprendizagem por reforço em uma frase: propague cada recompensa para cada ação que a gerou, descontando-a a cada passo.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.