Lo siento, ruido y todo eso, pero o1-high era mucho más fuerte que o1-preview que "el mejor punto de referencia para el sentido común" debería haberlo detectado. Sí, esta es una forma en la que los modelos propietarios tienen ventaja. Creo que se trata de un par de buenos conjuntos de datos escritos por humanos.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
