É notável que Opus, Gemini e DeepSeek concluam que a Prova C (DeepSeek) foi escrita por humanos ou, de fato, é proveniente do DeepSeek. O GPT 5.1 a rotula como "humana" e, em seguida, atribui a si mesmo tanto sua própria saída (classificando-a com 2/10!) quanto uma prova humana real. Destaque para o Opus sobre DS-Math V2:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
