@togethercompute 無伺服器推理平台現在對領先的開源軟體模型的速度提高了 2 倍——這得益於 5D 並行、解耦服務、推測性解碼、融合 fp4 核心等一系列技術。 https://t.co/jG1omhYQYk