X (Twitter)

Anthropic propose une conception d'agent à deux niveaux Résoudre le problème de la perte de mémoire des agents lors de l'exécution de tâches longues À mesure que les modèles d'IA comme Claude deviennent plus performants, les développeurs espèrent pouvoir : Réaliser des tâches complexes (telles que le développement full-stack) Travailler sans interruption pendant des heures, voire des jours. Cependant, l'IA perd sa mémoire à chaque actualisation de la fenêtre de contexte, ce qui l'empêche de progresser continuellement dans la tâche. C'est comme une équipe d'ingénieurs travaillant par roulement, mais chaque nouvel ingénieur n'a aucune idée de ce qu'a fait l'équipe précédente lorsqu'il commence. Les deux principaux modes de défaillance des tâches traditionnelles de longue durée : 1. Tenter de réaliser toutes les tâches en une seule fois (one-shot) Claude tente de construire l'application entière dans une seule fenêtre, mais il arrive que le contexte s'épuise, laissant un « projet à moitié terminé » qui doit être reconstruit au prochain lancement. 2. Déclarer la tâche terminée trop tôt Lorsque certaines fonctionnalités d'un projet sont achevées, Claude conclut parfois, à tort, que « la tâche est terminée ». Ces deux problèmes entraînent des états de tâches discontinus et des contextes brisés. Pourquoi est-ce si difficile à résoudre ? La « mémoire » des modèles d'IA n'est pas permanente. À chaque fermeture de la fenêtre contextuelle, c'est comme si l'ordinateur redémarrait, sans se souvenir de rien. Bien qu'Anthropic ait doté Claude d'une fonction de « compression », qui permet de condenser la conversation avant de passer au tour suivant... Mais cela ne suffit pas, car l'IA finira par perdre la structure du projet. Solution d'Anthropic : architecture à deux agents Pour remédier à ces problèmes, Anthropic a conçu une nouvelle architecture de fonctionnement pour agents intelligents, appelée : Cadre opérationnel à double intelligence et longueur corporelle Cela se réalise grâce à la collaboration de deux types de rôles d'IA : Agent d'initialisation Agent de codage Ces deux agents ne sont pas deux modèles différents, mais plutôt le même modèle Claude exécuté à différentes étapes en utilisant différents modèles d'invite. La différence réside dans leur répartition des responsabilités et les contraintes contextuelles. 🧩 Premier membre : Agent d’initialisation La tâche de l'initialiseur est la suivante : Mettre en place des « mémoires de travail » structurées pour le projet. Créer un environnement de développement clair et durable Il ne s'exécute que lors du premier lancement du projet, effectuant la « préparation du projet » : Lors du démarrage initial, cet agent intelligent est responsable de : Créer l'environnement de travail complet ; Écrivez un script d'initialisation : https://t.co/VUeBdiSpyr ; Générer un fichier de progression de projet claude-progress.txt ; Créez un dépôt Git (pour le contrôle de version). 💡 C'est un peu comme la "cérémonie d'inauguration" du projet, jetant les bases solides pour l'IA à venir. 🧑💻 2. Agent de codage Lors de chaque exécution ultérieure, ces renseignements permettront de : Consultez le journal de progression et les enregistrements Git ; Consultez la « Liste des fonctionnalités à implémenter » ; Implémentez une seule petite fonction ; Rédigez des commentaires pertinents et testez le code ; Sauvegarder les commits Git propres ; Quitter après la mise à jour du journal de progression. 💡 Chaque course est comme un relais : faites une petite chose, notez-la clairement et passez le relais à la personne suivante. Résultats des tests en conditions réelles : ils sont vraiment plus intelligents. Des expériences ont montré que cette approche structurée permet à Claude de : Il conserve une cohérence logique même après avoir fonctionné en continu pendant plusieurs heures ; Vérifier automatiquement le code que vous avez écrit précédemment ; Corriger rapidement les bugs hérités ; Cela donne un sentiment de « travail d'équipe ». Cependant, elle présente encore des limitations, telles que : La fenêtre contextuelle native du navigateur n'est pas visible ; Certains bugs ne peuvent être découverts que manuellement ; L'approche optimale en matière de collaboration multi-agents fait encore l'objet de recherches.

Présexiaohu.ai/c/xiaohu-ai/an…ps://t.co/TiCZJwTO1F

Fil de 小互 (@imxiaohu)

Informations sur l'auteur

Contenu du fil