Perspectiva alcista. En términos de capacidad bruta, sigue estando al nivel de la versión 3. Esto demuestra que LisanBench está indexando las ventajas de un aprendizaje por refuerzo bien implementado, y el de Moonshot es bastante bueno. Grok-fast es sorprendente.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.