Recentemente, houve um aumento significativo de artigos sobre como melhorar o desempenho de agentes inteligentes por meio de métodos adversários, e agora surgiu mais um artigo sobre multiagentes com correção de código! Ele afirma ter alcançado desempenho de última geração (SOTA) (79,4%) no ranking verificado do SWE-bench. Pode melhorar rapidamente a qualidade do código através da correção automática de erros. O método é simples: anteriormente, os testes automatizados só conseguiam abranger os casos que imaginávamos, mas era difícil cobrir os casos extremos. Então, eles criaram um examinador de casos de teste especificamente para definir perguntas que testassem o agente de aplicação de patches. É isso que o InfCode, introduzido por esta nova pesquisa, é: uma estrutura onde testes e correções se desafiam mutuamente por meio de iterações adversárias. Considere a geração de testes e a criação de patches como forças opostas. O teste tentou romper a proteção. Estão sendo desenvolvidas constantemente correções para que os testes sejam aprovados. Ambos se fortaleceram durante o conflito. Aprimore continuamente as correções para solucionar esses problemas. Eles começaram a gerar testes ainda mais difíceis. Repita esse processo até que a correção se torne robusta. Eles não são apenas testados antes do reparo. Em vez disso, identifica e fortalece continuamente os casos extremos. O método foi avaliado no SWE-Bench Verified e demonstrou melhorias mensuráveis na qualidade e cobertura dos patches. Isso reduziu as regressões e proporcionou uma reparação mais robusta. Link para o artigo:
Repostado de @omarsar0
@omarsar0 Antes de começar a ler, lembre-se de curtixaicreator.comar esta publicação. Este conteúdo no Threads foi publicado por um mecanismo de conteúdo colaborativo entre humanos e computadores. https://t.co/Gxsobg3hEN
@omarsar0 Por fim, obrigado por dedicar seu tempo para ler este tweet! Siga @Yangyixxxx para informações sobre IA, insights de negócios e estratégias de crescimento. Se você gostou deste conteúdo, curta e compartilhe o primeiro tweet para que mais pessoas possam acessar informações valiosas.
