La principal responsabilidad de un ingeniero es entregar código que pueda resistir el escrutinio. Este artículo, del último blog de Simon Willison, explora cómo los ingenieros de software pueden redefinir sus valores y responsabilidades fundamentales en la era de las herramientas de programación de IA generalizadas. Argumento clave: Generación de código económica versus entrega de alta calidad. En la era de la IA, la barrera y el coste de escribir código se han reducido a un nivel extremadamente bajo. Simon señala que simplemente generar código y enviar una solicitud de extracción (PR) ya no tiene ningún valor. Si un ingeniero usa IA para generar una gran cantidad de código, pero luego lo entrega a sus colegas para su revisión sin verificación, no solo constituye una grave negligencia, sino también una falta de respeto hacia los demás. El verdadero valor de un ingeniero reside en garantizar la corrección del código. ¿Cómo cumplir con la responsabilidad de “probar que el código es válido”? Simon cree que para demostrar que un código es válido se deben seguir estrictamente dos pasos indispensables: Paso 1: Pruebas manuales. Este es el punto más básico. El autor enfatiza un principio: si no ves que el código se ejecuta correctamente, asume que es defectuoso. • Ver para creer: debes ejecutar el código tú mismo y observar su comportamiento. • Proporcionar evidencia: Al enviar código para revisión, debe proporcionar evidencia de forma proactiva. Por ejemplo, pegue los registros de ejecución de la terminal en la descripción de la solicitud de revisión o, para cambios en la interfaz de usuario, adjunte grabaciones de pantalla o capturas de pantalla. • Cubra los bordes: no pruebe solo el mejor escenario posible; pruebe los casos extremos que son propensos a errores. Paso 2: Las pruebas automatizadas no son suficientes solo con pruebas manuales. El código base debe contener pruebas automatizadas que garanticen una eficacia continua. • Probar en lugar de verificar: Los cambios de código enviados deben incluir un nuevo caso de prueba. Idealmente, la prueba debería fallar antes del cambio de aplicación (rojo) y ser exitosa después del cambio de aplicación (verde). • La fortaleza de la IA: Los LLM modernos son muy buenos escribiendo código de prueba. El autor cree que, dado el poder de la IA actual, usar esto como excusa para no escribir pruebas es completamente inaceptable. • Relación complementaria: las pruebas automatizadas no pueden reemplazar completamente las pruebas manuales; ambas deben usarse en combinación y ninguna puede omitirse. El artículo "Reglas de supervivencia en la era de los agentes programables de IA" menciona una tendencia significativa para 2025: la proliferación de agentes de codificación capaces de realizar tareas de forma autónoma. En respuesta a esta tendencia, el autor ofrece consejos muy prácticos: Piensa como un mentor: Debes tratar a los agentes de IA como a tus empleados junior. Tu trabajo es capacitarlos y enseñarles a autovalidar su trabajo ejecutando código o escribiendo pruebas. El "gusto" determina la altitud: la IA destaca en la imitación. Si su proyecto ya cuenta con un conjunto de pruebas bien estructurado y con patrones definidos (lo que el autor llama "gusto"), la IA puede ampliar estas pruebas mediante imitación. • Aprovechar las funciones de la herramienta: Los agentes no se aburren escribiendo pruebas como los humanos; lo hacen con gusto. Como ingeniero sénior, deberías aprovechar esto para construir una buena cultura de pruebas. En conclusión: La responsabilidad humana es irremplazable. Por muy inteligente que se vuelva la IA, las computadoras nunca podrán responsabilizarse de los errores. Solo los humanos pueden. Hoy en día, generar miles de líneas de código mediante Prompt solo toma unos segundos, pero eso no tiene importancia. Lo que realmente importa es usted, como "humano involucrado", señalando con seguridad el código y diciéndole al equipo: "Asumo la responsabilidad de este código porque he demostrado que funciona". Entrada original del blog
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
