Résultats sur Cortex-AGI (génération procédurale pour créer des instances de puzzle uniques à l'exécution, donc une assez bonne mesure du raisonnement). La complexité augmente de façon exponentielle, donc 38 % << < 41 %. Speciale reste néanmoins à la pointe. Mais Grok 4.1 est sans doute tout aussi performant. Quant à GPT…
cortex-agi.com/?tab=methodolo…
oof


