A questão com o PaCoRe não é "um modelo 8B pode superar o GPT-5 em alguns benchmarks matemáticos" (claro que pode), mas sim "o quanto ele contribui para o avanço de modelos de ponta". Se a mesma lei de escala funcionasse para a versão 3.2, seria uma máquina de processamento de dados absolutamente incrível.
Sonhos de Gêmeos…


