Dotando a IA com "memória muscular": como os agentes podem aprender em tempo real e se tornarem mais inteligentes com o uso por meio da "experiência de indexação de estado"? Principal problema: a "amnésia" dos agentes de IA. Embora os agentes de IA atuais sejam inteligentes, eles geralmente apresentam uma falha fatal: não conseguem aprender após a implantação. • O modelo está "morto": uma vez que o modelo é treinado e implantado, seu conhecimento é fixo. • Falta de aprendizado com os erros: Se um agente não conseguir operar em uma página da web complexa hoje, poderá cometer o mesmo erro ao se deparar com a mesma página amanhã. • Falta de “memória muscular”: Os humanos adquirem habilidades por meio de “tentativa e erro” (conhecimento processual), enquanto os agentes de IA geralmente não possuem esse mecanismo de acumulação de habilidades a partir da experiência em tempo real. Solução: Sistema PRAXIS Para resolver esse problema, os autores propuseram um novo mecanismo chamado PRAXIS (Procedural Recall for Agents with eXperiences Indexed by State). Podemos pensar no PRAXIS como um "registro de erros em tempo real" ou um "memorando de experiência" do agente: • Experiência de gravação: Quando o agente executa uma tarefa, o PRAXIS grava silenciosamente cada ação realizada e suas consequências em segundo plano. • Correspondência de cenas: Quando o agente se depara novamente com uma cena semelhante (estado ambiental + estado interno), o PRAXIS recupera rapidamente experiências passadas. • Suporte à decisão: Informa ao agente: "Ei, clicar neste botão nesta tela da última vez teve sucesso (ou falhou)", guiando-o diretamente a fazer uma escolha melhor. Principais características técnicas: Plug-in leve: o PRAXIS não exige o retreinamento de modelos grandes; ele funciona mais como um módulo de memória externo de baixo custo. • Indexação dupla: Ela analisa não apenas o ambiente externo (como a aparência de uma página da web), mas também o estado interno do agente (como o plano atual), garantindo assim a precisão da correspondência de experiência. Resultados experimentais: Um sucesso retumbante na tarefa de navegação na Web. A equipe de pesquisa avaliou os resultados no benchmark REAL Web Browsing Benchmark, e os resultados mostram que: • Maior taxa de conclusão de tarefas: Agentes equipados com PRAXIS conseguem concluir tarefas complexas em páginas da web com mais precisão. • Mais econômico: Ao evitar desvios e reduzir tentativas ineficazes, o consumo de tokens e os custos operacionais são significativamente reduzidos. • Alta adaptabilidade: Para tarefas nunca antes vistas, desde que o ambiente seja semelhante, o agente pode resolver o problema por analogia com experiências passadas. Implicações e conclusões para a indústria: Este artigo propõe um caminho de baixo custo para que agentes de IA alcancem a "autoevolução". • Diga adeus à inteligência “única”: os agentes do futuro não serão mais ferramentas imutáveis, mas assistentes que se tornam mais convenientes e inteligentes quanto mais forem usados. • Lidar com ambientes dinâmicos: Especialmente em cenários onde a interface muda frequentemente, como navegação na web e operação de software, o mecanismo PRAXIS permite que o agente se adapte rapidamente à nova versão da interface do usuário, assim como um humano, sem ter que esperar que o fabricante do modelo lance uma nova versão. papel
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
