Gosto do Kimi, mas definitivamente não é tão inteligente assim, certamente não mais inteligente que o Claude 4.5 Sonnet. O Índice de Análise Artificial (e outros benchmarks) são um pouco enganosos, mas provavelmente as pessoas já sabiam disso. O Kimi comete erros simples e falhas de compreensão de leitura o tempo todo.
Acho que é por causa da quantização de 4 bits, porque, fora isso, o Kimi parece um modelo bem treinado. Se você apenas indicar um erro, geralmente ele o detectará, mas o problema mais sério é quando ele tenta analisar algo por conta própria: o resultado será ruim.