Test en conditions réelles du Gemini 3.0 Pro ! À la pointe de la technologie ! Mais deux problèmes importants ont été découverts ! Voici les résultats des tests de la version préliminaire de Gemini 3.0 Pro : Le test du dentifrice pour éléphant est à la pointe de la technologie (SOTA), avec des effets de particules incroyablement impressionnants. La façon dont le dentifrice est pulvérisé est encore plus réaliste que dans la version précédente, Kimi-K2-0905. De plus, la modélisation du flacon triangulaire atteint le niveau GPT-5 ; ces deux aspects (effets de particules et modélisation physique) sont donc à la pointe de la technologie. Cependant, la surface du liquide n'adhère pas parfaitement à la paroi interne du flacon ; à cet égard, claude-sonnet-4.5 est plus performant. La réaction en chaîne des pétards était assez intense, mais les secousses de la caméra étaient si violentes qu'ils sont sortis du cadre. Le nouveau mouvement tourbillon a également été testé et se trouve actuellement à la pointe de la technologie. On constate que la modélisation des dents d'engrenage de Claude présente des problèmes, tandis que celle de Gemini est très précise. Bien entendu, les deux modèles possèdent des échappements mal conçus. Le test de versement d'eau de Python était quasiment indiscernable de celui de l'Opus 4.1, à la pointe de la technologie. Ensuite, j'aborderai les problèmes que j'ai rencontrés avec le modèle. Premièrement, il semble privilégier les performances. Dans les scénarios que j'ai testés avec Three.js pour la modélisation, il m'arrivait souvent de ne pas voir certaines faces ou particules du modèle. Cela est dû à l'utilisation fréquente du frustum culling, qui consiste à ne pas afficher les éléments hors champ. Cependant, des erreurs de calcul surviennent fréquemment, ce qui entraîne la suppression d'éléments qui ne devraient pas l'être. Un autre problème important rencontré lors de l'utilisation du curseur est la chute brutale des performances du modèle lorsque le contexte atteint environ 100 000 éléments, provoquant même l'échec des appels d'outils. Je recommande vivement de surveiller attentivement les performances du modèle avec des contextes importants. À l'heure actuelle, il est difficile de déterminer s'il s'agit d'un bug ou d'un problème inhérent au modèle. En conclusion, impressionnant ! Je suggère à tous d'adopter immédiatement leur propre modèle de programmation et de le tester. Anthropic doit être en sueur. Avec la sortie de Gemini 3, Google a également lancé son propre EDI d'IA ; ils ne font pas les choses à moitié. Finalement, le moteur de la fusée Saturn V que vous avez vu au début a été réalisé avec Gemini 3 après de nombreuses modifications. Que pensez-vous du résultat ? #gemini #gemini3 #gemini3pro #google #KCORES Grande arène de modélisation
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.