La plataforma de inferencia sin servidor @togethercompute ahora es dos veces más rápida para los principales modelos OSS, a través de un conjunto de tecnologías que van desde paralelismo 5D, servicio desagregado, decodtogether.ai/blog/fastest-i… núcleos fp4 fusionados y más. https://t.co/jG1omhYQYk
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.