X (Twitter)

Anthropic propone un diseño de agente de dos capas Solución al problema de la pérdida de memoria de los agentes al realizar tareas largas A medida que los modelos de IA como Claude se vuelven más poderosos, los desarrolladores esperan poder: Realizar tareas complejas (como desarrollo full-stack) Trabajar continuamente durante horas o incluso días. Sin embargo, la IA pierde su memoria cada vez que se actualiza la ventana de contexto, lo que le impide avanzar continuamente en la tarea. Es como un equipo de ingenieros que trabaja por turnos, pero cada nuevo ingeniero no tiene idea de lo que hizo el turno anterior cuando comienza. Los dos modos de fallo principales de las tareas tradicionales de larga duración: 1. Intentar completar todas las tareas de una sola vez (one-shot) Claude intenta construir la aplicación completa en una sola ventana, pero a veces el contexto se agota, dejando un "proyecto a medio terminar" que debe reconstruirse en el próximo lanzamiento. 2. Declarar la tarea completada demasiado pronto Cuando se completa una parte de la funcionalidad de un proyecto, Claude a veces determina incorrectamente que "la tarea está terminada". Ambos problemas conducen a estados de tareas discontinuos y contextos rotos. ¿Por qué es tan difícil resolverlo? La "memoria" de los modelos de IA no es permanente. Cada vez que se cierra la ventana de contexto, es como una "computadora reiniciada" que no recuerda nada. Aunque Anthropic proporcionó a Claude una función de "compactación", que permite condensar la conversación antes de pasar a la siguiente ronda... Pero eso no es suficiente, porque la IA seguirá perdiendo el estado de proyecto estructurado. La solución de Anthropic: Arquitectura de arnés de dos agentes Para abordar estos problemas, Anthropic diseñó una novedosa arquitectura de trabajo de agente inteligente, denominada: Marco de operación de longitud corporal de inteligencia dual Se logra mediante la colaboración de dos tipos de roles de IA: Agente inicializador Agente de codificación Estos dos agentes no son dos modelos diferentes, sino más bien el mismo modelo de Claude ejecutándose en diferentes etapas utilizando diferentes plantillas de indicaciones. La diferencia radica en la división de responsabilidades y las limitaciones contextuales. 🧩 Primer miembro: Agente inicializador La tarea del Inicializador es: Establecer “memorias de trabajo” estructuradas para el proyecto. Crear un entorno de desarrollo claro y sostenible Solo se ejecuta cuando se lanza el proyecto por primera vez, realizando la "preparación del proyecto": Durante el inicio inicial, este agente inteligente es responsable de: Crear todo el ambiente de trabajo; Escriba un script de inicialización: https://t.co/VUeBdiSpyr; Generar un archivo de progreso del proyecto claude-progress.txt; Crear un repositorio Git (para control de versiones). 💡 Es como la "ceremonia inaugural" del proyecto, sentando una base sólida para la IA posterior. 🧑💻 2. Agente de codificación En cada ejecución posterior, esta inteligencia: Leer el registro de progreso y los registros de Git; Ver la "Lista de características a implementar"; Implementar sólo una pequeña función; Escribe buenos comentarios y prueba el código; Guardar confirmaciones de Git limpias; Salir después de actualizar el registro de progreso. 💡Cada carrera es como una etapa de una carrera de relevos: haz algo pequeño, regístralo con claridad y pásaselo a la siguiente persona. Resultados de pruebas en el mundo real: Realmente son más inteligentes. Los experimentos han demostrado que este enfoque estructurado permite a Claude: Mantiene la consistencia lógica incluso después de funcionar continuamente durante varias horas; Comprueba automáticamente el código que escribiste anteriormente; Corrija rápidamente errores heredados; Da una sensación de "trabajo en equipo". Sin embargo, todavía tiene limitaciones, como: La ventana emergente nativa del navegador no es visible; Algunos errores sólo pueden descubrirse manualmente; El enfoque óptimo para la colaboración entre múltiples agentes aún está bajo investigación.

Introxiaohu.ai/c/xiaohu-ai/an…s://t.co/TiCZJwTO1F

Hilo de 小互 (@imxiaohu)

Información del autor

Contenido del hilo