L'ampleur même de l'ambition 🐳 : Les LLM peuvent démontrer des théorèmes non triviaux. Prenons PutnamBench. Notre meilleur système atteint 7,4 %. Il reste encore beaucoup de travail. Tout le monde : 😮 ooooO c'est l'heure💯 de l'ascension ! Notre nouvelle idée de « décomposition des problèmes »… 15 % ! 35 % ! 70 % ! - 🐋 : Ça suffit. 118/120, saturé
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.