RT @awnihannun: La última versión de MLX con Qwen3 30B A3B (4 bits) procesa una solicitud de tokens de 10k en ~10 segundos en un M5 de 32 GB. Bastante útil: https://t…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.