Executando o gpt-oss-20b no OpenRouter, obtenho 32/100 no benchmark. Executando o gpt-oss-20b no VLLM com H200S, obtenho 83/100 no benchmark. O que esses provedores estão fazendo? Resultados terríveis da Deepinfra.
Fornecedores completamente inúteis, sinceramente não dá para confiar neles.