Práctica de implementación de agentes de IA de programación backend de Spotify (se fusionaron con éxito más de 1500 relaciones públicas generadas por IA) Problemas fundamentales y soluciones Si bien el sistema de gestión de flotas de Spotify destaca por automatizar tareas sencillas, los cambios de código complejos han demostrado ser un desafío constante. Los métodos tradicionales requieren la manipulación de árboles de sintaxis abstracta o expresiones regulares, lo que exige un alto nivel de experiencia. Por ejemplo, su script de actualización de dependencias de Maven supera las 20 000 líneas de código. La idea central del equipo es reemplazar los scripts de migración deterministas con agentes inteligentes definidos en lenguaje natural, mientras se conserva toda la infraestructura de Fleet Management (la selección del repositorio de destino, el inicio de relaciones públicas, la revisión y los procesos de fusión permanecen completamente sin cambios). Fase 1 de la evolución tecnológica: Exploración de herramientas de código abierto. El equipo probó herramientas de código abierto como Goose y Aider, pero resultó difícil generar PR fusionables de forma fiable en escenarios de migración a gran escala. Fase Dos: Bucle de Desarrollo Propio. Desarrollaron un "bucle de agente" basado en la API de LLM, que consta de tres pasos: indicaciones proporcionadas por el usuario, edición de archivos por parte del agente e integración de la retroalimentación de la compilación, y finalización tras superar las pruebas o alcanzar los límites. Esto es adecuado para cambios pequeños, pero a menudo agota los bucles o pierde contexto al gestionar cambios complejos de varios archivos. Fase tres: Código Claude Claude Code se ha consolidado como el agente con mejor rendimiento, tras haberse utilizado en aproximadamente 50 migraciones y la mayoría de las solicitudes de incorporación de cambios (PR) de producción. Admite indicaciones más naturales orientadas a tareas, gestiona listas de tareas y deriva agentes secundarios de forma eficiente. Principios clave del proyecto 1. Ajustes basados en las características del agente: los agentes desarrollados internamente son adecuados para instrucciones estrictas paso a paso, mientras que Claude Code es más adecuado para describir el estado final y permitir la autonomía. 2. Definir condiciones previas: los agentes a menudo actúan con demasiada prisa; es necesario definir claramente cuándo no deben actuar. 3. Utilice ejemplos concretos: unos pocos ejemplos de código concretos pueden afectar en gran medida los resultados. 4. Definir objetivos verificables, idealmente presentados como pruebas, evitando instrucciones vagas. 5. Un cambio a la vez: combinar varios cambios tiene más probabilidades de agotar el contexto o producir resultados parciales. 6. Solicite retroalimentación al agente: una vez finalizada la conversación, el agente puede señalar cualquier deficiencia en las sugerencias. Herramientas y gestión del contexto Spotify emplea una estrategia de herramientas conservadora para mantener la previsibilidad. Sus agentes solo pueden acceder a: • Herramientas de validación: Ejecutar formateo, análisis estático y pruebas. • Herramientas de Git restringidas: Estandarizar las operaciones de Git y prohibir las inserciones o modificaciones a repositorios remotos. • Comandos de Bash permitidos: como ripgrep. En lugar de exponer herramientas de búsqueda de código o documentación, requieren que los usuarios incluyan previamente el contexto relevante en las sugerencias. La filosofía de diseño es: cuantas más herramientas, más impredecibles serán las dimensiones. El sistema, como se ha demostrado en aplicaciones prácticas, ha gestionado tareas de migración complejas, entre ellas: • Modernización del lenguaje (por ejemplo, migración de tipos de valores de Java a registros) • Actualizaciones con cambios disruptivos • Migraciones de componentes de la interfaz de usuario • Actualizaciones de perfiles. Estas migraciones ahorraron entre un 60 % y un 90 % del tiempo. Y lo que es más importante, desde mediados de 2024, aproximadamente la mitad de las relaciones públicas de Spotify se han generado automáticamente mediante este sistema. Los equipos de aplicaciones, además de la migración, integran agentes en Slack y GitHub Enterprise mediante el protocolo MCP. El flujo de trabajo es el siguiente: el agente interactivo primero recopila información de la tarea, genera indicaciones y luego las entrega al agente de codificación para su ejecución y creación de PR. Esto permite a los ingenieros capturar registros de decisiones arquitectónicas de los hilos de Slack o a los gerentes de producto proponer cambios sencillos sin necesidad de compilar localmente. Retos por resolver El equipo de Spotify señaló con franqueza las limitaciones actuales: • Problemas de rendimiento y previsibilidad • Falta de sugerencias estructuradas/métodos de evaluación de modelos • Dificultad para verificar si las relaciones públicas realmente resuelven el problema original • Todavía se basa principalmente en la intuición y el ensayo y error para desarrollar sugerencias Parte 1: https://t.co/M5pJCeL5Ds Parte 2:
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
