X (Twitter)

Qwen3-Max-Prueba de pensamiento en el mundo real! Eh... Aquí están los resultados de las pruebas para Qwen3-Max-Thinking-Preview: La imagen de la prueba de la pasta de dientes de elefante se ve oscura, pero en realidad se debe a problemas de iluminación. He hecho zoom para que vean el efecto. El modelado y los efectos de partículas también son mediocres. La tarea está mal cumplimentada. La prueba de la montaña rusa fue un éxito; aunque las juntas no eran perfectamente lisas, no había grietas y los pilares de soporte mostraban signos de moldeo. La función de explosión en cadena de petardos no funciona correctamente; no se completa la demostración y los efectos físicos son incorrectos. Además, la tasa de éxito es muy baja; solo una de cada seis tiradas no presentó errores de código. Verter agua en una taza usando Python es posible; es un requisito para aprobar estos modelos de razonamiento. Además, la interfaz web durante el proceso de generación es demasiado sofisticada, y la solicitud no necesita ser tan compleja, pero está diseñada para ser exagerada. Entonces, ¿sería mejor desarrollar una página front-end? La respuesta es no. Le pedí que creara un sitio web de imágenes con estilo cascada, lo cual pone a prueba las habilidades de diseño front-end, como se puede apreciar en los resultados. Su diseño presentaba problemas; todas las tarjetas estaban apiladas. En contraste, glm-4.6 estaba muy bien diseñado, con un diseño CSS perfecto en diferentes escalas. En resumen, dado que se trata de una versión preliminar, lo mejor es centrarse en seguir formándose y mejorando. No se recomienda utilizar este modelo para tareas de programación a corto plazo. #Qwen3 #KCORES Arena de modelos grandes

Hilo de karminski-牙医 (@karminski3)

Información del autor

Contenido del hilo