Efecto secundario de impedir que las empresas chinas compren las mejores tarjetas NVIDIA: ahora se está entrenando explícitamente a los modelos de gama alta para que funcionen bien en GPU más antiguas/baratas. El nuevo modelo SoTA de @Kimi_Moonshot utiliza operaciones BF16 sencillas y antiguas (después de la desquantización de INT4); no es necesario el costoso soporte FP4.
Esta es una excelente noticia para todos nosotros. Significa un acceso más económico a los mejores modelos disponibles para todos. 非常感谢 @Kimi_Moonshot! :D
