X (Twitter)

Como um agente pode usar o sistema de arquivos para implementar engenharia de contexto? O argumento central da postagem no blog da @LangChainAI é que a principal razão para o fracasso dos agentes atuais não é mais a insuficiência das capacidades do modelo, mas sim os métodos obsoletos de gerenciamento de contexto. A equipe propõe o uso de um "sistema de arquivos" como espaço de trabalho externo do agente para resolver completamente uma série de problemas persistentes com os RAGs tradicionais em tarefas complexas, inaugurando a era da "engenharia de contexto". Por que os sistemas de arquivos podem melhorar significativamente a confiabilidade dos agentes? O RAG tradicional depende da busca semântica em bancos de dados vetoriais, o que apresenta quatro problemas críticos: • Propenso a perder informações importantes ou a recordar uma grande quantidade de ruído irrelevante. • Desempenho extremamente fraco na recuperação de código, documentos longos e dados estruturados. • Incapaz de localizar com precisão linhas, funções ou capítulos específicos. • Esquece informações importantes quando a janela de contexto está cheia e esquece completamente a cada reinicialização da conversa. O sistema de arquivos + recuperação de símbolos (ls, glob, grep) evita perfeitamente os problemas acima: • Gravação em arquivo → Armazenamento persistente, nunca esquecido • Obtenha recuperação precisa e sem ruído usando caminhos, nomes de arquivos, palavras-chave, números de linha, etc. • Resultados grandes são gravados primeiro em um arquivo, e os menores fragmentos necessários são carregados sob demanda para evitar a explosão de tokens • Suporta a autoevolução do agente: comandos recém-aprendidos, preferências do usuário e casos de sucesso são gravados em um arquivo e permanecem válidos permanentemente. LangChain lança duas ferramentas úteis 1. File-Agent Toolkit (Conjunto de ferramentas de manipulação de arquivos de agente único) Inclui comandos como read_file, write_file, append_file, list_directory, glob e grep. Uso típico: Uma pesquisa na web retorna 10 mil tokens → Primeiro, escreva o arquivo inteiro → Use o grep para extrair precisamente 100 a 200 linhas relevantes → Em seguida, alimente o modelo com essas informações. 2. No modo colaborativo do Sistema de Arquivos Multiagente, vários subagentes não trocam mais informações por meio de mensagens (o que é propenso a distorções e desperdício de tokens), mas compartilham o mesmo diretório de trabalho: • Os subagentes registram suas descobertas, conclusões e dados em um arquivo predefinido. • O agente mestre lê o arquivo mais recente a qualquer momento para manter a consistência global. Isso resolve completamente o problema de distorção de informações causado pelo "telefone sem fio" entre múltiplos agentes, tornando-o particularmente adequado para tarefas de pesquisa complexas e de longo prazo. Boas práticas recomendadas para engenharia de contexto: • Qualquer saída grande (resultados de pesquisa, código, planos de longo prazo) deve ser gravada em um arquivo primeiro. • Todos os planos, instruções e preferências do usuário também devem ser gravados em um arquivo para armazenamento permanente. • Priorize a busca simbólica (grep/glob) em relação à busca vetorial pura durante a recuperação para garantir a precisão. • Use um pequeno número de buscas vetoriais como pontos de entrada, seguidas por buscas detalhadas secundárias usando ferramentas do sistema de arquivos. • Dê ao agente seu próprio "diretório inicial" e permita que ele trabalhe como um programador.

Thread de meng shao (@shao__meng)

Informações do autor

Conteúdo da thread