X (Twitter)

¡Google lanzó Gemini 3 a altas horas de la noche, haciendo gala de capacidades inigualables en programación, uso de herramientas y comprensión multimodal, dando paso a la era Gemini 3! Codificación Vibe Una sola frase en lenguaje natural puede generar una aplicación totalmente interactiva, ocupando el primer puesto en la clasificación de WebDev Arena en el número 1487. Codificación de agentes Terminal-Bench 2.0 obtuvo un 54,2%, demostrando compatibilidad con la reconstrucción entre archivos, la depuración de contextos largos y la implementación de funciones. También desarrollaron una plataforma de desarrollo de agentes inteligentes: Google Antigravity, que permite programar múltiples agentes inteligentes en paralelo para completar tareas de software complejas, como la planificación, la escritura de código y la verificación de apertura de navegadores. Varios agentes pueden ejecutarse simultáneamente. La comprensión multimodal establece nuevos récords en pruebas comparativas de inferencia de gráficos/vídeo complejos como MMMU-Pro y Video-MMMU, admitiendo contextos largos con 1 millón de tokens. Las nuevas características incluyen fidelidad visual ajustable y capacidades de comprensión de documentos que superan el OCR tradicional, lo que permite un razonamiento complejo, comprensión espacial/de pantalla, predicción de trayectorias y otras funciones. Estas capacidades se pueden aplicar a la conducción autónoma, la realidad extendida (XR), la robótica y otros escenarios. También está el Gemini 3 Deep Think, que es incluso mejor que el Gemini 3 Pro. #Géminis3

Vívelaistudio.google.com/appsu3xZblog.google/technology/dev…o/akdHWaqmae

Vívelo aquí: https://t.co/pku3xZBdsV
Blog: https://t.co/akdHWaqmae

Hilo de AIGCLINK (@aigclink)

Información del autor

Contenido del hilo