¿Los sistemas multiagente a menudo decepcionan? El problema quizá no esté en los agentes en sí, sino en cómo están organizados. La mayoría de los sistemas utilizan estructuras fijas de cadena, árbol o gráfico que no se pueden ajustar a medida que cambian las tareas. ¿Pero qué pasaría si el sistema pudiera aprender sus propios patrones de colaboración? Este artículo innovador presenta un marco llamado Puppeteer, que puede orquestar agentes dinámicamente en lugar de depender de topologías prediseñadas. El punto clave es: • En lugar de estructuras colaborativas predefinidas, un coordinador selecciona al siguiente agente que hablará según el estado del diálogo, que cambia constantemente. • La estrategia de entrenamiento del algoritmo REINFORCE optimiza directamente la tasa de éxito de la tarea. • En lugar de buscar topologías de gráficos complejas, serialice todo el contenido en opciones de agente continuas, evitando así la complejidad combinatoria. El resultado fue sorprendente: Esto conduce naturalmente a un patrón compacto y cíclico, en lugar de una estructura de gráfico grande, en la que 2 o 3 agentes manejan la mayor parte del trabajo. Aún más impresionante es que el sistema puede detectar de forma autónoma problemas de eficiencia. Presentación de resultados: • En problemas matemáticos GSM-Hard: la precisión alcanza el 70% (en comparación con solo el 13,5% cuando se utiliza solo el modelo base). • En MMLU-Pro: 83% (línea base 76%). • En desarrollo de software SRDD: 76,4% (línea base 60,6%). Estas mejoras vienen acompañadas de una reducción en los costes de los tokens. El artículo muestra que el costo del token continúa disminuyendo durante todo el proceso de entrenamiento, mientras que el rendimiento mejora. También demostraron que el proceso de selección de agentes satisface la propiedad de Markov, lo que significa que el estado actual puede determinar el próximo agente óptimo sin tener que rastrear todo el historial. entonces: Para los desarrolladores de IA, la simplicidad en el aprendizaje es mejor que la complejidad elaborada. Un enrutador entrenado, junto con algunos agentes inteligentes especializados, puede superar un flujo de trabajo bien diseñado y al mismo tiempo reducir la sobrecarga computacional.
Este contenido fue xaicreator.com. https://t.co/Gxsobg3hES
Enlacopenreview.net/pdf/9727f658d7…/t.co/XtGCdCeZbC
¡Gracias por tomarte el tiempo de leer este tweet! Sigue a @Yangyixxxx para obtener información sobre IA, perspectivas empresariales y estrategias de crecimiento. Si te gustó este contenido, dale a "Me gusta" y comparte el primer tuit para difundir información valiosa.
