Unimos fuerzas con NVIDIA para desbloquear la inferencia de IA de alta velocidad en PC con IA RTX y DGX Spark usando llama.cpp. Los últimos modelos Ministral-3B alcanzan más de 385 tok/s en sistemas GeForcedeveloper.nvidia.com/blog/nvidia-ac…_PC. Blog: https://t.co/60yKKzNnoN
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.