O programador qwen 3 está atualmente com 2359 tps no Cerebras. gpt-oss é 2092 tps Dentro de 3 meses teremos um modelo OSS otimizado para codificação e chamada de ferramentas, equivalente aos modelos de última geração, capaz de atingir mais de 2000 transações por segundo no Cerebras.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.