L'annonce officielle du Gemini 3 a été publiée. LMArena a obtenu un score impressionnant de 1501 points, se hissant en tête du classement. Lancée et désormais opérationnelle, la suite complète (recherche, application, API) est prête à l'emploi dès aujourd'hui. Ils ont même lancé un mode Deep Think similaire à O1, ainsi qu'une toute nouvelle plateforme de développement d'agents. Voici un résumé des points clés de cette mise à jour 👇 Amélioration spectaculaire des capacités de raisonnement Le Gemini 3 Pro est désormais le modèle multimodal le plus performant au monde. Il a dominé le classement LMArena avec un score de 1501. Il a obtenu un score de 37,5 % au redoutable examen « Humanity's Last Exam », et ses capacités mathématiques ont également établi un nouveau record sur MathArena. Qu'il s'agisse d'interpréter des graphiques complexes ou de résoudre des problèmes mathématiques ardus, sa capacité de compréhension et sa finesse ont atteint un niveau inédit. Google a désormais adopté un mode de réflexion approfondie similaire à celui d'O1, avec Deep Think dans Gemini 3. Deep Think consacre plus de temps au raisonnement, notamment pour résoudre des problèmes complexes nécessitant une analyse poussée. Les tests montrent qu'il est nettement plus performant que la version Pro, mais il est actuellement utilisé en priorité par les testeurs de sécurité ; les utilisateurs d'Ultra devront patienter encore quelques semaines. Une nouvelle ère dans le développement d'agents : l'antigravité Pour les développeurs, l'avancée la plus significative est sans doute la nouvelle plateforme Google Antigravity. Gemini 3 offre des améliorations substantielles en matière de génération de code et de planification à long terme, atteignant un score de 76,2 % sur le benchmark SWE. Antigravity transforme l'IA en un véritable partenaire, capable de planifier, d'écrire du code et même de disposer d'autorisations d'accès à l'éditeur et au terminal, contrôlant le navigateur pour vérifier l'exécution du code : une expérience véritablement intégrée. Fusion de la mémoire et de la multimodalité Gemini 3 utilise toujours une fenêtre contextuelle d'un million de jetons, mais il traite des informations provenant d'un éventail de dimensions beaucoup plus large. Par exemple, vous pouvez lui envoyer une photo de votre ancienne recette manuscrite, et il peut la convertir en version électronique ; ou vous pouvez lui envoyer une vidéo d'une partie de pickleball, et il peut analyser vos mouvements et créer un plan d'entraînement. Il ne s'agit plus seulement de lire du texte, mais de véritablement « comprendre la scène ».
Google semble pressé par le calendrier de sortie du Gemini 3, mais ils sont aussi vraiment sérieux à ce sujet. Tout d'abord, il y a la rapidité de mise en œuvre. Auparavant, on se contentait de publier des articles et de s'en vanter ; désormais, il s'agit de déployer immédiatement les solutions dès leur sortie, sur l'ensemble de la gamme de produits, y compris la recherche, les applications, AI Studio et Vertex AI. C'est ce type d'exécution que Google devrait adopter. Deuxièmement, il y a Antigravity. Son nom, « antigravité », est plutôt intéressant : il semble vouloir s’affranchir des contraintes du développement traditionnel. L’agent n’est plus une simple boîte de dialogue, mais une entité indépendante dotée de droits d’édition et d’accès au terminal ; c’est l’avenir de la programmation en IA. Enfin, la bataille pour les modèles à grande échelle entre dans une phase concrète. L'écart en matière de capacités des modèles se réduit ; la compétition porte désormais sur la capacité à intégrer plus rapidement ces capacités dans des produits et à les rendre accessibles au grand public. L'offre de Google, combinant recherche, application et cloud, met la pression sur OpenAI.
