Sistemas multiagentes frequentemente decepcionam? O problema pode não estar nos agentes em si, mas na forma como estão organizados. A maioria dos sistemas utiliza estruturas fixas de cadeia, árvore ou grafo que não podem ser ajustadas conforme as tarefas mudam. Mas e se o sistema pudesse aprender seus próprios padrões de colaboração? Este artigo inovador apresenta uma estrutura chamada Puppeteer, que pode orquestrar agentes dinamicamente em vez de depender de topologias pré-definidas. O ponto principal é: • Em vez de estruturas colaborativas predefinidas, um coordenador seleciona o próximo agente a falar com base no estado do diálogo, que está em constante mudança. • A estratégia de treinamento do algoritmo REINFORCE otimiza diretamente a taxa de sucesso da tarefa. • Em vez de pesquisar topologias de grafos complexas, serialize todo o conteúdo em escolhas contínuas de agentes, evitando assim a complexidade combinatória. O resultado foi surpreendente: Isso leva naturalmente a um padrão compacto e cíclico, em vez de uma grande estrutura gráfica, na qual 2 a 3 agentes lidam com a maior parte do trabalho. Mais impressionante ainda é que o sistema consegue detectar problemas de eficiência de forma autônoma. Apresentação de Resultados: • Em problemas matemáticos de nível GSM-Hard: a precisão atinge 70% (em comparação com apenas 13,5% quando o modelo base é usado isoladamente). • No MMLU-Pro: 83% (linha de base de 76%). • No desenvolvimento de software SRDD: 76,4% (linha de base de 60,6%). Essas melhorias são acompanhadas por uma redução nos custos dos tokens. O artigo demonstra que o custo do token continua a diminuir ao longo do processo de treinamento, enquanto o desempenho melhora. Eles também provaram que o processo de seleção de agentes satisfaz a propriedade de Markov, o que significa que o estado atual pode determinar o próximo agente ideal sem precisar rastrear todo o histórico. então: Para desenvolvedores de IA, a simplicidade no aprendizado é melhor do que a complexidade elaborada. Um roteador treinado, juntamente com alguns agentes inteligentes especializados, pode superar um fluxo de trabalho bem projetado, reduzindo a sobrecarga computacional.
Este conteúdo foi gxaicreator.comttps://t.co/Gxsobg3hEN
Link openreview.net/pdf/9727f658d7…t.co/XtGCdCeZbC
Obrigado por dedicar seu tempo para ler este tweet! Siga @Yangyixxxx para informações sobre IA, insights de negócios e estratégias de crescimento. Se você gostou deste conteúdo, curta e compartilhe o primeiro tweet para disseminar informações valiosas para mais pessoas.
