X (Twitter)

WarpGrep est un sous-agent de récupération de contexte rapide, conçu spécifiquement pour les agents de programmation. Il résout les problèmes courants liés à la recherche et à la gestion du contexte. En isolant le processus de récupération dans un système optimisé par apprentissage par renforcement, WarpGrep améliore considérablement les performances globales de l'agent. Une création de l'équipe @morphllm ! Diagnostic du problème : Points faibles des agents de codage - Temps de recherche excessif : Les agents de codage passent généralement 60 % de leur temps à rechercher des fichiers et du contexte, au lieu d’écrire du code. Cela entraîne des interruptions dans le flux de travail du développeur ; les études montrent que pour chaque seconde d’attente supplémentaire, la probabilité d’abandon du projet par le développeur augmente de 10 %. • Pollution du contexte : Dans les grands ensembles de code en production, des informations non pertinentes peuvent « empoisonner » les décisions du modèle, entraînant des modifications de fichiers incorrectes, un gaspillage de jetons et une augmentation exponentielle des coûts. Dans les tâches à séquences longues, cette pollution peut réduire la précision du modèle jusqu’à 70 %. Le mécanisme de base de WarpGrep traite la recherche contextuelle comme un sous-système indépendant, utilisant un modèle d'optimisation d'inférence entraîné par apprentissage par renforcement pour les commandes grep et glob, ainsi que pour la lecture de fichiers. Il comprend intelligemment la structure du code source, prend en charge des entrées contextuelles extrêmement longues et maintient un rappel élevé. Caractéristiques principales : • Appels d'outils parallèles : Un maximum de 8 opérations parallèles (telles que grep, list, read) par tour, strictement contrôlées pour être effectuées en 4 tours. • Conception optimisée : Le moteur d'inférence pour les tâches grep (retravail pré-rempli) se concentre sur « la récupération de la plage de fichiers/lignes correcte + la vitesse ». • Compatibilité matérielle : Fonctionne à 900 jetons/seconde sur une carte graphique NVIDIA B200 (environ 38 % plus rapide que SWE-Grep de Cognition, qui fonctionne à 650 jetons/seconde). Morph collabore avec NVIDIA pour tirer parti de CUDA et bénéficier d’optimisations personnalisées et stables. Données de performance et impact • Amélioration quantitative : L’intégration de WarpGrep dans les modèles de pointe peut améliorer le taux d’achèvement des tâches de 5 à 12 %, accélérer l’exécution de 40 %, réduire la consommation de jetons de 40 % et diminuer la pollution du contexte de 70 %. Cette solution est particulièrement adaptée aux tâches de longue durée, comme la maintenance de vastes bases de code. • Perspective plus large : L’auteur cite le concept de « vallée de la mort semi-asynchrone » de @swyx, soulignant que WarpGrep aide les développeurs à maintenir des flux de travail efficaces grâce à une accélération de la recherche multipliée par 10 et une réduction de la pollution de plus de 50 %. Morph est optimiste quant à la tendance des sous-agents : les moteurs d’inférence dédiés aux tâches et l’invocation parallèle deviendront la norme pour les agents codés. Intégration et disponibilité : Plug and play : S'intègre parfaitement avec Claude Code, Codex, OpenCode ou d'autres agents de codage via Morph MCP Server ou SDK.

Fil de meng shao (@shao__meng)

Informations sur l'auteur

Contenu du fil