Hace un año, SWE-Bench tenía la ambición de asumir que los modelos podrían codificar o amenazar los trabajos de los programadores. Este progreso está impulsado directamente por una fuerte inversión en datos de codificación de agentes. Nada impide que esto ocurra en otras profesiones.
También descubriremos qué profesiones realmente se benefician del "toque humano". Lamentablemente, serán muchas menos de las que se cree.