Ai2 vient de sortir une série de petits modèles à poids ouvert pour olmo3, notamment Olmo-3-1125-32B (modèle de base), Olmo-3-32B-Think, Dolci-Think-SFT-7B, Dolci-Instruct-SFT-7B, Dolci-Think-DPO-7B, Dolci-Instruct-DPO-7B, Dolci-Think-RL-7B et Dolci-Instruct-RL-7B. Le score de l'Olmo-3-32B-Think semble n'être devancé que par celui du Qwen3-32B. Il ne prend en charge que l'anglais. La caractéristique la plus distinctive de cette série de modèles est qu'elle propose des modèles issus de plusieurs étapes d'entraînement et de mise au point, ce qui permet aux utilisateurs d'effectuer eux-mêmes le post-entraînement ou la mise au point. J'ai fait un test rapide (Figure 4), et ça a l'air correct ?
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.



