我們與 NVIDIA 攜手合作,利用 llama.cpp 在 RTX AI PC 和 DGX Spark 上實現了高速 AI 推理。最新的 Ministral-3B 型號在 @NVIDIA_AI_PC GeForce RTX 5090 系統上達到了 385+ tok/s 的運算速度。 部落格:https://t.co/60yKKzNnoN
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月2日 晚上7:01
我們與 NVIDIA 攜手合作,利用 llama.cpp 在 RTX AI PC 和 DGX Spark 上實現了高速 AI 推理。最新的 Ministral-3B 型號在 @NVIDIA_AI_PC GeForce RTX 5090 系統上達到了 385+ tok/s 的運算速度。 部落格:https://t.co/60yKKzNnoN