X (Twitter)

OS 推論エンジンが、さまざまなレートですべてのモデルにわたってこの問題を抱えている理由がわかりません。これは GLM 4.6 で、ここには openrouter 経由の 23/10000 サンプルがこれに該当します。つまり、vllm または sglang のいずれかです... この問題は 2 年間発生していますが、その間、gpt/claude などでは、50 万件以上の応答の中で、おそらく 2 回か 3 回しかこのような現象を見たことはありません。

Teknium (e/λ)（@Teknium）のスレッド

作者情報

スレッド内容