X (Twitter)

Gemini 3 de Google a été lancé tard dans la nuit, vantant des capacités inégalées en matière de programmation, d'utilisation d'outils et de compréhension multimodale, inaugurant ainsi l'ère Gemini 3 ! Codage d'ambiance Une simple phrase en langage naturel peut générer une application entièrement interactive, se classant première au classement de WebDev Arena à la 1487e place. Codage agentique Terminal-Bench 2.0 a obtenu un score de 54,2 %, prenant en charge la reconstruction inter-fichiers, le débogage de contexte long et l'implémentation de fonctionnalités. Ils ont également développé une plateforme de développement d'agents intelligents : Google Antigravity, qui permet de planifier l'exécution parallèle de plusieurs agents intelligents pour réaliser des tâches logicielles complexes, telles que la planification, l'écriture de code et la vérification d'ouverture de navigateur. Plusieurs agents peuvent ainsi fonctionner simultanément. La compréhension multimodale établit de nouveaux records dans les benchmarks d'inférence de graphes/vidéos complexes tels que MMMU-Pro et Video-MMMU, prenant en charge de longs contextes avec 1 million de jetons. Les nouvelles fonctionnalités incluent une fidélité visuelle ajustable et des capacités de compréhension de documents supérieures à celles de la reconnaissance optique de caractères (OCR) traditionnelle, permettant un raisonnement complexe, la compréhension spatiale et visuelle, la prédiction de trajectoires, et d'autres fonctions. Ces capacités peuvent être appliquées à la conduite autonome, à la réalité étendue (XR), à la robotique et à d'autres domaines. Il y a aussi le Gemini 3 Deep Think, qui est encore meilleur que le Gemini 3 Pro. #Gémeaux3

Découaistudio.google.com/apps.co/blog.google/technology/dev…s://t.co/akdHWaqmae

Découvrez-le ici : https://t.co/pku3xZBdsV
Blog : https://t.co/akdHWaqmae

Fil de AIGCLINK (@aigclink)

Informations sur l'auteur

Contenu du fil