NVIDIAと協力し、llama.cppを用いてRTX AI PCとDGX Spark上で高速AI推論を実現しました。最新のMinistral-3Bモデルは、@NVIDIA_AI_PCのGeForce RTX 5090システムで385tok/s以上のパフォーマンスを達成しました。 ブログ: https://t.co/60yKKzNnoN
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/12/02 19:01
NVIDIAと協力し、llama.cppを用いてRTX AI PCとDGX Spark上で高速AI推論を実現しました。最新のMinistral-3Bモデルは、@NVIDIA_AI_PCのGeForce RTX 5090システムで385tok/s以上のパフォーマンスを達成しました。 ブログ: https://t.co/60yKKzNnoN