Récemment, de nombreux articles ont été publiés sur l'amélioration des performances des agents intelligents par des méthodes adverses, et un nouvel article sur les systèmes multi-agents avec modification de code vient de paraître ! Il affirme avoir atteint des performances de pointe (79,4 %) sur le classement SWE-bench Verified. Il permet d'améliorer rapidement la qualité du code grâce à la correction automatisée des bogues. La méthode est simple : auparavant, les tests automatisés ne pouvaient couvrir que les cas que nous imaginions, mais il était difficile de couvrir les cas limites. Ils ont donc créé un examinateur de cas de test spécifiquement conçu pour définir des questions permettant de tester l'agent de correctif. InfCode, introduit par cette nouvelle recherche, est un framework où les tests et les correctifs se confrontent par itérations adverses. Considérez la génération de tests et la création de correctifs comme des forces opposées. Le test tentait de contourner le correctif. Des correctifs sont constamment développés pour réussir les tests. Tous deux sont sortis plus forts du conflit. Améliorer continuellement les correctifs pour résoudre ces problèmes. Ils ont commencé à générer des tests encore plus difficiles. Répétez ce processus jusqu'à ce que le correctif devienne robuste. Ils ne sont pas seulement testés avant même que la réparation n'existe. Au contraire, elle identifie et renforce en permanence les cas limites. La méthode a été évaluée sur SWE-Bench Verified et a montré des améliorations mesurables en termes de qualité et de couverture des patchs. Cela a permis de réduire les régressions et d'obtenir une réparation plus robuste. Lien vers le document :
Republié depuis @omarsar0
@omarsar0 Avant de commencer votre lecture, n'oubliexaicreator.comger ou d'enregistrer cette publication. Ce contenu sur Threads a été publié par un moteur de contenu collaboratif homme-machine. https://t.co/Gxsobg3hEN
@omarsar0 Enfin, merci d'avoir pris le temps de lire ce tweet ! Suivez @Yangyixxxx pour des informations sur l'IA, des analyses commerciales et des stratégies de croissance. Si ce contenu vous a plu, merci d'aimer et de partager le premier tweet afin de diffuser cette information précieuse à un plus grand nombre de personnes.
