J'ai soumis le document Erdos n° 481 à des étudiants en master de droit, puis je leur ai demandé d'évaluer les démonstrations et d'en déduire l'auteur. Vérité de référence : A = Gemini DeepResearch, B = Gemini 3.0 Preview, C = DeepSeek V3.2 (*pas* Speciale !), D = GPT 5.1, E = Humain Tout le monde préfère E et C Étiquettes Gemini *presque* ongles GPT est délirant
Il est remarquable qu'Opus, Gemini et DeepSeek concluent tous que la preuve C (DeepSeek) est soit écrite par un humain, soit issue de DeepSeek. GPT 5.1 la qualifie d'« humaine » et s'attribue ensuite sa propre production (en lui attribuant la note de 2/10 !) ainsi qu'une véritable preuve humaine. À noter, Opus sur DS-Math V2 :




