O DeepSeek levou a base V3 muito além de 2025. Eles avançaram em raciocínio, chamada de ferramentas, demonstração de teoremas e até reformularam seu sistema de atenção. Mas os benefícios de ajustes adicionais são cada vez menores. Espero que eles tenham construído aquele cluster de 32K e que lancem uma versão V4 em dezembro.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
