Es un perfil de habilidades… interesante. Por debajo de DSV3.2 en HLE, MMLU-Pro y algunos otros, es muchísimo más fuerte en aspectos agentivos, domina a todos en SimpleQA… Y luego está toda esta multimodalidad, incluso a la par con Veo3. Tengo la impresión de que es muy grande y poco entrenado.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.