Um resultado curioso é que outros laboratórios coletam e treinam seus modelos nesse conjunto de dados, enquanto a OpenAI não, o que faz com que o desempenho da OpenAI piore com o tempo.
(flashback para as pontuações HLE do DeepSeek)
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
2 tweets · 17 de dez. de 2025, 07:07
Um resultado curioso é que outros laboratórios coletam e treinam seus modelos nesse conjunto de dados, enquanto a OpenAI não, o que faz com que o desempenho da OpenAI piore com o tempo.
(flashback para as pontuações HLE do DeepSeek)