X (Twitter)

¡Prueba de pensamiento realista de Kimi-K2! ¡La brecha sigue reduciéndose! Aquí están los resultados de la prueba de pensamiento K2 de Kimi: La prueba de la pasta de dientes de elefante transcurrió sin problemas; ¡parece que las propiedades físicas han mejorado de nuevo! La textura viscosa se asemeja cada vez más a la de la pasta de dientes de elefante, pero el nivel de líquido en el frasco aún no es el correcto. Las explosiones en cadena con petardos tampoco suponen ningún problema; siempre han sido uno de sus puntos fuertes. Puedes ver la comparación con el anterior Kimi K2 0905; la apariencia de los petardos se ha mejorado. Los nuevos resultados de las pruebas también fueron muy buenos; en comparación, casi no hubo diferencia entre los resultados generados por Claude-Sonnet-4.5 y los generados por Claude-Sonnet-4.5. La prueba de vertido de agua de Python también es mucho mejor en comparación con la versión 0905. Además, en esta ocasión se añadieron pruebas de la página de interfaz. La creación de una página con diseño en cascada también funcionó sin problemas y el efecto de escalado fue bueno. Finalmente, también preparé algo para todos: un desafío de programación Extreme Vibe de dos horas. Creamos un clon de Claude Code, Rock Code, usando Claude Code y Kimi K2 Thinking, lo que nos permitió escribir código, editar archivos y ejecutar scripts localmente. Todo el proceso transcurrió sin problemas. En conclusión, aunque los modelos a gran escala de producción nacional aún no han superado a Claude, ¡se están acercando cada vez más! Antropo, ¿ya te asustaste? #kimi #ElLadoOscuroDeLaLuna #kimik2pensando #VibeCoding

Hilo de karminski-牙医 (@karminski3)

Información del autor

Contenido del hilo