Até o Weibo está fazendo testes de raciocínio agora. Qwen2.5-Math-1.5B ajuste fino, caso você queira saber. Mas o método deles, baseado na entropia, faz sentido, mesmo que pudessem ter citado mais trabalhos anteriores.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.

