X (Twitter)

Se ha publicado el anuncio oficial del Gemini 3. LMArena alcanzó la impresionante cifra de 1501 puntos, liderando las listas. Ya está disponible y en funcionamiento; toda la plataforma (búsqueda, aplicación, API) se puede usar a partir de hoy. Incluso lanzaron un modo Deep Think similar a O1 y una plataforma de desarrollo de agentes completamente nueva. Aquí tenéis un resumen de los aspectos más destacados de esta actualización 👇 Mejora épica de la capacidad de razonamiento El Gemini 3 Pro es ahora el modelo multimodal más potente del mundo. Alcanzó el primer puesto en las listas de LMArena con una puntuación de 1501. Logró un 37,5 % en el notoriamente difícil Examen de la Última Prueba de la Humanidad, y sus capacidades matemáticas también establecieron un nuevo récord en MathArena. Ya sea interpretando gráficos complejos o resolviendo problemas matemáticos desafiantes, su profundidad y sofisticación de comprensión han alcanzado un nuevo nivel. Google ha adoptado un modo de análisis más pausado similar al de O1 con Deep Think en Gemini 3. Deep Think dedica más tiempo al razonamiento, abordando específicamente problemas complejos que requieren un análisis minucioso. Los datos de las pruebas muestran un rendimiento significativamente superior al de la versión Pro, pero actualmente la están utilizando primero los evaluadores de seguridad; los usuarios de Ultra tendrán que esperar unas semanas más. Una nueva era en el desarrollo de agentes: Antigravedad Para los desarrolladores, el avance más significativo probablemente sea la nueva plataforma Google Antigravity. Gemini 3 ofrece mejoras sustanciales en la generación de código y la planificación a largo plazo, alcanzando una puntuación del 76,2 % en SWE-bench. Antigravity transforma la IA en un verdadero aliado, capaz de planificar, escribir código e incluso gestionar permisos de editor y terminal, controlando el navegador para verificar la ejecución del código: una experiencia verdaderamente integral. Fusión de la memoria y la multimodalidad Gemini 3 sigue utilizando una ventana de contexto de 1 millón de tokens, pero procesa información de una gama más amplia de dimensiones. Por ejemplo, puedes enviarle una foto de tu antigua receta manuscrita y la organizará en una versión electrónica; o puedes enviarle un vídeo de un partido de pickleball y analizará tus movimientos y creará un plan de entrenamiento. Ya no se limita a leer texto, sino que realmente «comprende la escena».

Google parece tener prisa con el calendario de lanzamiento del Gemini 3, pero también se lo toman muy en serio. En primer lugar, está la velocidad de implementación. Antes, todo giraba en torno a publicar artículos y presumir; ahora, se trata de lanzar inmediatamente después del lanzamiento, en toda la línea de productos, incluyendo la búsqueda, las aplicaciones, AI Studio y Vertex AI. Este es el tipo de ejecución que debería caracterizar a Google. En segundo lugar, está Antigravity. El nombre es bastante interesante —«antigravedad»— y parece buscar liberarse de las limitaciones del desarrollo tradicional. El Agente ya no es un simple cuadro de diálogo, sino una entidad independiente con permisos de editor y terminal; este es el futuro de la programación de IA. Finalmente, la batalla por los modelos a gran escala ha entrado en una fase práctica. La brecha en las capacidades de los modelos se está reduciendo; ahora la competencia se centra en quién puede integrar esas capacidades en los productos más rápidamente y hacerlos accesibles para el público general. La combinación de búsqueda, aplicaciones y nube de Google ha ejercido presión sobre OpenAI.

Hilo de 歸藏(guizang.ai) (@op7418)

Información del autor

Contenido del hilo