Según una filtración de la cuenta X TestingCatalog: Google ha añadido un modo de "investigación automática" multiagente a Gemini Enterprise. (https://t.co/aBhEeNzIge) Google está desarrollando un sistema multiagente en Gemini para empresas. Se le proporciona un tema y un conjunto de criterios de evaluación, y puede generar automáticamente multitud de ideas. Posteriormente, puede reunir a un equipo completo de agentes y revisar estas ideas ronda tras ronda, como si se tratara de un torneo. Este sistema puede funcionar de forma continua durante unos 40 minutos seguidos. Para un producto destinado a usuarios empresariales comunes, se trata de un proceso de inferencia continua muy prolongado. Al finalizar estos 40 minutos, los usuarios recibirán una larga lista de ideas, ordenadas de mejor a peor según los criterios que hayan establecido inicialmente. El sistema puede generar aproximadamente 100 ideas a la vez. Por cada idea, recibirá: - Una visión general - Una explicación más detallada - Resumen de la reseña - Una reseña completa y extensa - Y un informe específico sobre el rendimiento en el torneo. Este "Informe de rendimiento" es un documento independiente que puede abrir y revisar cuando lo desee. Todas las ideas generadas son seleccionables; puede hacer clic en cualquiera para obtener más información. En la versión beta actual, Google parece haber creado tres agentes, dos de los cuales se basan en este sistema de "torneo" multiagente. La primera se llama "Generación de Ideas". En este modo, solo necesitas proporcionar un tema, y el agente iniciará un flujo de trabajo multiagente completo, utilizando una "evaluación tipo torneo" para generar y clasificar diversas ideas relevantes. (La llamada evaluación tipo torneo significa que las soluciones "compiten" constantemente entre sí, de modo que las ganadoras permanecen y las más débiles son eliminadas). El segundo se llama "Co-científico". Esta opción está más orientada a escenarios de investigación y desarrollo científico. Puedes especificar un tema de investigación, proporcionar datos adicionales y, a continuación, un equipo completo de agentes inteligentes generará líneas de investigación y planes. Posteriormente, utilizará el mismo mecanismo de torneo para evaluar estas ideas, pero esta vez con énfasis en las necesidades de la investigación y la exploración científica. Lo más interesante aquí es la increíble potencia de cálculo que requiere. Permitir que un agente trabaje de forma continua en una tarea durante unos 40 minutos se considera una configuración de lujo en la mayoría de las herramientas de agentes actuales. Durante los 40 minutos, el sistema itera continuamente sobre el problema, generándolo, filtrándolo, puntuándolo y reorganizándolo constantemente. Actualmente, todo esto solo existe en Gemini para Empresas, se encuentra en fase de desarrollo interno, está oculto para los usuarios comunes y aún no se ha lanzado al público como una función oficial. En comparación con las implementaciones de agentes existentes, esto representa un avance significativo. Incluso los agentes avanzados que ya cuentan con funcionalidades similares a las de un navegador suelen estar limitados por ventanas de contexto y límites de tiempo. En esta ocasión, el enfoque de Google consiste en poner directamente a disposición de sus clientes empresariales una gran capacidad de procesamiento, creando una interfaz de usuario legítima para sus productos. Esto se alinea perfectamente con el concepto de "IA de Nivel 3": este nivel de agente de IA se caracteriza por su capacidad para trabajar de forma continua en el mismo problema durante un periodo considerable. (Aquí, "Nivel 3" no es un estándar unificado, sino un término informal del sector para referirse a "agentes capaces de trabajar de forma continua durante largos periodos"). Desde esta perspectiva, que un agente ejecute una sola tarea durante 40 minutos es un ejemplo muy típico, incluso algo radical. En la práctica, el resultado principal de este sistema es un conjunto de ideas bien filtradas y refinadas. Pero estas son mucho más que una simple colección aleatoria de sugerencias; pueden considerarse un conjunto estructurado de líneas de investigación: dados los datos y el contexto del problema, estas líneas tienen el potencial de generar información realmente valiosa. Por lo tanto, el desarrollo por parte de Google de esta potente capacidad de agente, específicamente al servicio de organizaciones, empresas y equipos de investigación, resulta bastante interesante. Cuando esta función se lance finalmente al público, podría suponer un avance significativo, sobre todo si estos agentes utilizan Gemini 3 Pro. Actualmente, Gemini 3 Pro aún no está disponible en Gemini Enterprise, por lo que se desconoce qué modelo se utiliza en estos agentes experimentales. Aún queda mucho por probar y verificar. Al enviar una solicitud al sistema, este primero proporciona un resumen de lo planeado: las dimensiones a evaluar y las direcciones desde las cuales se generarán y filtrarán las ideas. Solo después de que usted confirme este resumen, el sistema ejecutará la tarea principal. Esto equivale a acordar con usted cómo se pretende comprender su problema antes de utilizar una gran cantidad de recursos computacionales. Además del flujo de trabajo del torneo multiagente, Gemini Enterprise cuenta con otro agente llamado "Chatea con tus documentos", que tiene su propia interfaz de usuario. Este agente permite a los usuarios subir archivos PDF de hasta 30 MB y luego entablar conversaciones específicas con dichos documentos. Esta función también forma parte de Gemini Enterprise, pero aún no se ha lanzado al público ni está disponible en entornos de producción. Su diseño permite analizar contenido PDF de hasta 30 MB e integrarlo en el contexto del modelo, lo que facilita la extracción de información valiosa de los documentos existentes en lugar de depender únicamente del paso de página manual. Se están desarrollando muchas otras funciones en Gemini Enterprise, pero estas dos líneas son sin duda las más llamativas: 1. Flujo de trabajo de estilo torneo multiagente 2. Agentes inteligentes especializados orientados a documentos En particular, la arquitectura multiagente basada en torneos parece ser un enfoque de producto innovador; otros proveedores de servicios de Modelos de Lenguaje Grande (LLM) no parecen ofrecer nada similar a este nivel. Los torneos multiagente aún son muy poco comunes en las herramientas para usuarios finales. Quizás Grok Heavy podría servir como comparación, pero es improbable que siga la misma línea que el enfoque de Google. Una vez que estos agentes alcancen la madurez, sería fundamental contar con un sistema de evaluación formal y pruebas comparativas. Incluso con la descripción actual, el agente Co-científico ya resulta lo suficientemente atractivo como para entusiasmar a numerosas organizaciones y equipos de investigación de gran tamaño, especialmente a aquellos que exploran nuevas direcciones científicas. En cuanto a cuándo se lanzarán oficialmente estos agentes inteligentes, o si estarán disponibles para usuarios no empresariales, todo esto se desconoce actualmente. fuente:
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.