NVIDIA와 협력하여 llama.cpp를 사용하여 RTX AI PC와 DGX Spark에서 고속 AI 추론을 구현했습니다. 최신 Ministral-3B 모델은 @NVIDIA_AI_PC GeForce RTX 5090 시스템에서 385+ tok/s에 도달합니다. 블로그: https://t.co/60yKKzNnoN
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 2. 오후 7:01
NVIDIA와 협력하여 llama.cpp를 사용하여 RTX AI PC와 DGX Spark에서 고속 AI 추론을 구현했습니다. 최신 Ministral-3B 모델은 @NVIDIA_AI_PC GeForce RTX 5090 시스템에서 385+ tok/s에 도달합니다. 블로그: https://t.co/60yKKzNnoN