RT @fujikanaeda : si le bon ODD peut faire en sorte qu’un modèle à 50 millions de paramètres obtienne un MMLU non aléatoire. et peut faire raisonner un modèle 300M comme un champion. toi…
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.