Y eso probablemente ponga fin a la era PutnamBench en los programas de maestría en matemáticas. Para crear evaluaciones mejores y más diversas, no encuentro una alternativa a los benchmarks sintéticos, y esto será difícil.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.