Es notable que Opus, Gemini y DeepSeek concluyan que la Prueba C (DeepSeek) es escrita por humanos o, de hecho, proviene de DeepSeek. GPT 5.1 la etiqueta como "humana" y luego se asigna tanto su propio resultado (¡calificándola con 2/10!) como una prueba humana real. Cabe destacar el Opus sobre DS-Math V2:
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
