A magnitude da ambição é imensa. 🐳: Os LLMs podem provar teoremas não triviais. Vamos usar o PutnamBench. Nosso melhor sistema alcança 7,4%. Ainda há muito trabalho a ser feito. Todos: 😮 ooooO É HORA💯 de escalar a colina! Nossa ideia inovadora de "decompor problemas"… 15%! 35%! 70%! - 🐋: Chega. 118/120, saturado
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.