DeepSeek a considérablement repoussé les limites de la version 3 au-delà de 2025. Des progrès ont été réalisés au niveau du raisonnement, de l'appel d'outils, de la démonstration de théorèmes, et même du système d'attention. Cependant, les améliorations supplémentaires n'apportent plus qu'un gain marginal. J'espère qu'ils ont construit ce cluster 32K et qu'ils livreront une V4 en décembre.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
