Sinceramente, eu também não entendo isso. Isso me frustra, porque eu preferiria que eles aumentassem os preços nos horários de pico do que reduzir a quantidade de modelos disponíveis e diminuir a qualidade dos equipamentos justamente quando eu mais preciso. É só melhorar a medição, certo? Alguém pode me explicar isso?
Por que minha startup precisa competir por ciclos de GPU com programadores amadores que programam por prazer, crianças fazendo a lição de casa e outros? Não poderíamos usar a discriminação de preços para segmentar melhor o mercado? Qual a justificativa para não fazer isso?
O mistério é que todos os fornecedores são culpados disso. Todos eles usam o Model IQ para manipular o consumo em vez de adotar um sistema de medição dinâmica, semelhante ao das redes elétricas, em que se paga mais durante os horários de pico. Nenhum deles se destaca nesse aspecto. Então, há algo importante que estou deixando passar.
É, quanto mais penso nisso, mais estranho me parece. A eletricidade medida em tempo real é o principal insumo industrial, e os tokens de streaming em tempo real são o principal produto, então por que a cobrança por tokens é fixa e não uma margem de lucro em tempo real sobre os custos de eletricidade?