Recientemente, ha surgido una oleada de artículos sobre la mejora del rendimiento de agentes inteligentes mediante métodos adversarios, ¡y ahora ha surgido otro artículo sobre multiagentes con parches de código! Este afirma haber alcanzado un rendimiento de vanguardia (SOTA) (79,4 %) en la clasificación verificada de SWE-bench. Puede mejorar rápidamente la calidad del código mediante la corrección automática de errores. El método es simple: antes, las pruebas automatizadas sólo podían cubrir los casos que imaginábamos, pero era difícil cubrir los casos extremos. Entonces crearon un examinador de casos de prueba específicamente para establecer preguntas para probar el agente de parcheo. Esto es lo que InfCode, introducido por esta nueva investigación, es un marco donde las pruebas y los parches se desafían entre sí a través de iteraciones adversarias. Considere la generación de pruebas y la creación de parches como fuerzas opuestas. La prueba intentó romper el parche. Constantemente se desarrollan parches para pasar las pruebas. Ambos se hicieron más fuertes en el conflicto. Mejorar continuamente los parches para solucionar estos problemas. Comenzaron a generar pruebas aún más difíciles. Repita este proceso hasta que el parche se vuelva robusto. No se prueban simplemente antes de que exista la reparación. Más bien, identifica y fortalece continuamente casos extremos. El método se evaluó en SWE-Bench Verified y mostró mejoras mensurables en la calidad y cobertura del parche. Redujo las regresiones y logró una reparación más robusta. Enlace del artículo:
Re-publicado por @omarsar0
@omarsar0 Antes de empezar a leer, recuerda darle mexaicreator.comrdar esta publicación. Este contenido en Threads fue publicado por un motor de contenido colaborativo humano-computadora. https://t.co/Gxsobg3hES
@omarsar0 Por último, ¡gracias por tomarte el tiempo de leer este tweet! Siga a @Yangyixxxx para obtener información sobre IA, conocimientos comerciales y estrategias de crecimiento. Si te ha gustado este contenido, dale me gusta y comparte el primer tweet para difundir información valiosa a más personas.
