Melhoria incrível na pontuação HLE de 4.7 para Kimi-K2-Instruct para 44,9 para Kimi-K2-Thinking Basicamente, os chineses também podem construir seus próprios "cientistas de pesquisa em IA" míticos. As respostas às perguntas mais profundas parecem muito boas.
Peço desculpas. Estava comparando coisas diferentes. Mesmo assim, é um salto considerável de 21,7 para 44,9. Incrível.

