X (Twitter)

¿Cómo puede un agente utilizar el sistema de archivos para implementar la ingeniería de contexto? El argumento principal de la entrada del blog de @LangChainAI es que la principal causa del fracaso de los agentes actuales no son las capacidades insuficientes del modelo, sino los métodos obsoletos de gestión del contexto. El equipo propone utilizar un "sistema de archivos" como espacio de trabajo externo del agente para resolver por completo una serie de problemas persistentes con los RAG tradicionales en tareas complejas, lo que introduce a los agentes en la era de la "ingeniería de contexto". ¿Por qué los sistemas de archivos pueden mejorar significativamente la confiabilidad del agente? El RAG tradicional se basa en la búsqueda semántica de bases de datos vectoriales, lo que presenta cuatro problemas fatales: • Propenso a perder información clave o a recordar una gran cantidad de información irrelevante. • Rendimiento extremadamente bajo al recuperar código, documentos extensos y datos estructurados. • Incapaz de localizar con precisión líneas, funciones o capítulos específicos. • Olvida información importante cuando la ventana de contexto está llena y la olvida por completo cada vez que se reinicia la conversación. El sistema de archivos + recuperación de símbolos (ls, glob, grep) evita perfectamente los problemas anteriores: • Escribir en archivo → Almacenamiento persistente, nunca lo olvide • Logre una recuperación precisa y sin ruido usando rutas, nombres de archivos, palabras clave, números de línea, etc. • Los resultados grandes primero se escriben en un archivo y los fragmentos más pequeños necesarios se cargan a pedido para evitar la explosión de tokens • Admite la autoevolución del agente: los comandos recién aprendidos, las preferencias del usuario y los casos de éxito se escriben en un archivo y permanecen efectivos de forma permanente. LangChain lanza dos herramientas útiles 1. File-Agent Toolkit (Conjunto de herramientas de manipulación de archivos de un solo agente) Incluye comandos como read_file, write_file, append_file, list_directory, glob y grep. Uso típico: una búsqueda web devuelve 10 000 tokens → Primero se escribe el archivo completo → Se usa grep para extraer con precisión entre 100 y 200 líneas relevantes → Luego se lo suministra al modelo. 2. En el modo colaborativo del sistema de archivos multiagente, varios subagentes ya no intercambian información mediante mensajes (lo que es propenso a la distorsión y al desperdicio de tokens), sino que comparten el mismo directorio de trabajo: Los subagentes escriben sus hallazgos, conclusiones y datos en un archivo predefinido. El agente maestro lee el archivo más reciente en cualquier momento para mantener la coherencia global. Esto soluciona por completo el problema de distorsión de la información causado por el "juego telefónico" entre múltiples agentes, lo que lo hace especialmente adecuado para tareas de investigación complejas y a largo plazo. Prácticas recomendadas para la ingeniería de contexto: • Cualquier resultado grande (resultados de búsqueda, código, planes a largo plazo) debe escribirse primero en un archivo. • Todos los planes, instrucciones y preferencias de usuario también deben escribirse en un archivo para la memoria permanente. • Priorice la búsqueda simbólica (grep/glob) sobre la búsqueda vectorial pura durante la recuperación para garantizar la precisión. • Utilice un número reducido de búsquedas vectoriales como puntos de entrada, seguidas de búsquedas detalladas secundarias mediante herramientas del sistema de archivos. • Asigne al agente su propio directorio de inicio y permítale trabajar como un programador.

Hilo de meng shao (@shao__meng)

Información del autor

Contenido del hilo