O DeepSeek apresentou um ganho *significativo* em MAFS (acertos na primeira tentativa) em ambas as principais atualizações de seus modelos de raciocínio (R1 <<< R1-0528 << V3.1). Imagino que a versão V3.2-exp seja equivalente à V3.1. Quem a descarta está bastante enganado.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
