La nueva versión de Gemini Deep Research ha logrado un rendimiento líder en múltiples puntos de referencia de tareas de investigación: Obtuvo una puntuación de vanguardia del 46,4% en el Último Examen de Humanidad (HLE Conocimiento y Razonamiento Integrados). Tuvo un desempeño excepcional en DeepSearchQA (investigación web de múltiples pasos), con una puntuación del 66,1 %. También tuvo un desempeño excepcional en BrowseComp (tarea de navegación y comparación), con una puntuación del 59,2%. Todos ellos son logros de última generación.
Google cree que los grandes modelos lingüísticos están evolucionando desde “herrxiaohu.ai/c/xiaohu-ai/go…de texto de un solo uso” a “sistemas inteligentes que pueden realizar tareas de manera sostenible”. La API de interacciones es la infraestructura diseñada para este propósito. https://t.co/JKbP7fgQnh

