我们与 NVIDIA 携手合作,利用 llama.cpp 在 RTX AI PC 和 DGX Spark 上实现了高速 AI 推理。最新的 Ministral-3B 型号在 @NVIDIA_AI_PC GeForce RTX 5090 系统上达到了 385+ tok/s 的运算速度。 博客:https://t.co/60yKKzNnoN
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月2日 19:01
我们与 NVIDIA 携手合作,利用 llama.cpp 在 RTX AI PC 和 DGX Spark 上实现了高速 AI 推理。最新的 Ministral-3B 型号在 @NVIDIA_AI_PC GeForce RTX 5090 系统上达到了 385+ tok/s 的运算速度。 博客:https://t.co/60yKKzNnoN