X (Twitter)

Google Gemini 3 est enfin disponible après une longue attente ! Ce modèle d'IA, le plus puissant jamais conçu, offre des avancées significatives en matière de raisonnement, de compréhension multimodale et de capacités des agents, atteignant des performances quasi universelles de pointe. Son lancement a été annoncé conjointement par le PDG de Google et le PDG/directeur technique de DeepMind. 1. Le positionnement et l'amélioration globale de Gemini 3 Le modèle le plus puissant de Google à ce jour, surpassant largement son prédécesseur Gemini 2.5 Pro, atteint des performances de pointe dans presque tous les principaux tests d'IA. Les principales améliorations comprennent : • Capacité de raisonnement améliorée : meilleure compréhension de l’intention de l’utilisateur, fournissant des réponses plus concises, directes et pertinentes. Capacités multimodales de pointe : prise en charge native et transparente du traitement du texte, des images, de la vidéo, de l’audio et du code. • Les capacités des agents intelligents ont été considérablement améliorées : le modèle peut utiliser des outils de manière autonome, planifier des tâches en plusieurs étapes, faire fonctionner des terminaux informatiques et même effectuer des simulations de prise de décision à long terme. • La fenêtre de contexte s'étend jusqu'à 1 million de jetons, ce qui la rend adaptée à la gestion de documents très longs ou de conversations complexes. • Un nouveau mode « Gemini 3 Deep Think » a été ajouté pour améliorer encore les capacités d’inférence. Il est actuellement disponible pour les testeurs de sécurité et les abonnés à Google AI Ultra. 2. Données clés de performance Le Gemini 3 Pro s'est classé premier dans la plupart des catégories : • Classement des préférences des utilisateurs de LMArena : 1501 Elo (N° 1 au classement général) Le dernier examen de l'humanité (un casse-tête de niveau expert) : Mode normal 37,5 %, Mode réflexion approfondie 41,0 % • GPQA Diamond (raisonnement scientifique de niveau doctorat) : 91,9 % en mode normal, 93,8 % en mode de réflexion approfondie • MMMU-Pro (Compréhension graphique multimodale) : 81 % • Test d'aptitude mutuelle en compréhension vidéo (Video-MMMU) : 87,6 % • Vérifié par SimpleQA (exactitude des faits) : 72,1 % • Vérifié par SWE-bench (Tâche réelle d'ingénierie logicielle) : 76,2 % (nettement supérieur à la génération précédente) • WebDev Arena (Capacité d'agent de développement Web) : 1487 Elo (Premier) Terminal-Bench 2.0 (Utilisation de l'outil Terminal) : 54,2 % • ARC-AGI-2 (Novel Abstract Reasoning Challenge) : Mode de réflexion approfondie + exécution de code 45,1 % 3. Exemples d'application pratique et apprentissage : Télécharger des recettes manuscrites → Générer automatiquement des livres de cuisine maison magnifiquement conçus ; Analyser des articles universitaires → Générer des flashcards interactives ou des graphiques visuels. • Création et construction : Générez des poèmes de réaction de fusion et des animations visuelles à l'aide de formules physiques ; créez rapidement des jeux 3D complets ou de l'art voxel. • Planification et gestion : Permettre aux modèles de gérer de manière autonome les boîtes de réception Gmail et de simuler les opérations commerciales des distributeurs automatiques pendant de nombreuses années et d'optimiser les revenus. • Expérience de recherche : Générer des interfaces visuelles immersives (telles que des interprétations de type magazine des peintures de Van Gogh) dans le mode IA de la recherche Google et prendre en charge les outils interactifs. 4. Disponibilité et méthodes d'accès • Utilisateurs réguliers : L'application Gemini (mobile/web) a été directement mise à niveau vers Gemini 3 et est disponible gratuitement pour tous. • Fonctionnalités avancées : les abonnés Google AI Pro/Ultra peuvent utiliser un mode « Réflexion » plus puissant dans le mode de recherche IA ; le mode Deep Think est disponible en premier lieu pour les utilisateurs Ultra. • Développeurs/entreprises : Accessible via Google AI Studio, Vertex AI, Gemini API et Google Antigravity, avec prise en charge des chaînes d’outils tierces (telles que Cursor et Replit). C’est la première fois que Google intègre un modèle à sa recherche le jour même de sa sortie, ce qui démontre les avantages d’une distribution à grande échelle. 5. Sécurité et responsabilité Google souligne que Gemini 3 est son modèle d'évaluation de sécurité le plus complet à ce jour : • Adopte le cadre de sécurité Frontier le plus récent. • Collaborer avec des experts et des organisations externes d'équipes rouges, comme UK AISI, pour les tests. • Améliore considérablement la résistance aux vulnérabilités d'injection, aux utilisations abusives dans les cyberattaques et autres menaces. • La réponse met davantage l'accent sur les « véritables analyses » que sur la complaisance envers les utilisateurs.

Fil de meng shao (@shao__meng)

Informations sur l'auteur

Contenu du fil