Acho que é por causa da quantização de 4 bits, porque, fora isso, o Kimi parece um modelo bem treinado. Se você apenas indicar um erro, geralmente ele o detectará, mas o problema mais sério é quando ele tenta analisar algo por conta própria: o resultado será ruim.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.