Tenemos TPU en el espacio. Tengo una implementación de DiLoCo ejecutándose en TPU. ¿Cuándo llegará el aprendizaje distribuido cósmico?
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.