OS 推論エンジンが、さまざまなレートですべてのモデルにわたってこの問題を抱えている理由がわかりません。これは GLM 4.6 で、ここには openrouter 経由の 23/10000 サンプルがこれに該当します。つまり、vllm または sglang のいずれかです... この問題は 2 年間発生していますが、その間、gpt/claude などでは、50 万件以上の応答の中で、おそらく 2 回か 3 回しかこのような現象を見たことはありません。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
