Petit modèle, grande logique L'optimisation axée sur la diversité permet d'obtenir des capacités de raisonnement sur des modèles de grande taille dans VibeThinker-1.5B.
Discutez-huggingface.co/papers/2511.06…cK8OH
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
2 tweets · 12 nov. 2025, 15:17
Petit modèle, grande logique L'optimisation axée sur la diversité permet d'obtenir des capacités de raisonnement sur des modèles de grande taille dans VibeThinker-1.5B.
Discutez-huggingface.co/papers/2511.06…cK8OH