Há um ano, o SWE-Bench tinha a ambição de assumir que os modelos poderiam codificar ou ameaçar os empregos de programadores. Esse progresso é impulsionado diretamente pelo grande investimento em dados de codificação de agentes. Nada impede que isso aconteça em outras profissões.
Descobriremos também quais profissões realmente se beneficiam do "toque humano". Tragicamente, serão muito menos do que as pessoas imaginam.