Teste prático de raciocínio lógico Qwen3-Max! Uh... Aqui estão os resultados dos testes para Qwen3-Max-Thinking-Preview: A imagem de teste da pasta de dente de elefante parece escura para todos, mas isso se deve a problemas de iluminação. Dei um zoom para mostrar o efeito. A modelagem e os efeitos de partículas também são medíocres. O desafio está mal executado. O teste da montanha-russa foi bem-sucedido; embora as juntas não estivessem perfeitamente lisas, não havia rachaduras e os pilares de sustentação apresentavam sinais de moldagem. O recurso de explosão em cadeia de fogos de artifício não funciona bem; não consegue completar a demonstração da explosão em cadeia e os efeitos físicos estão incorretos. Além disso, a taxa de sucesso é muito baixa; apenas uma em cada seis tentativas ocorreu sem erros de código. Despejar água em um copo usando Python é possível; é um requisito básico nesses modelos de raciocínio. Além disso, a interface web durante o processo de geração é excessivamente sofisticada, e o prompt não precisa ser tão complexo, mas foi projetado para ser exagerado. Então, seria melhor escrever uma página de front-end? A resposta é não. Pedi para criar um site de imagens no estilo cascata, o que realmente testa as habilidades de layout de front-end, como você pode ver pelos resultados. O layout apresentou problemas; todos os elementos estavam amontoados. Em contraste, o glm-4.6 foi escrito muito bem, com um layout CSS perfeito em diferentes proporções de escala. Em resumo, considerando que esta ainda é uma versão de pré-visualização, o melhor é focar em treinamento e aprimoramento adicionais. Não é recomendável usar este modelo para tarefas de programação a curto prazo. #Qwen3 #KCORES Arena Modelo Grande
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.