Siento que es extraño que la gente piense que están cuantificando los modelos de frontera. Es casi 100%, en mi opinión, que todos ya se ejecutan en FP4 y cualquier cosa menor no está optimizada para las GPU de Nvidia y supongo que también para las TPU y Trainium, etc.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.