X (Twitter)

Un año de experiencia práctica en el desarrollo de agentes de IA de nivel de producción, compartido por el equipo de @posthog Veámoslo desde cuatro dimensiones: filosofía arquitectónica, implementación táctica, dificultades de desarrollo y experiencia del producto. I. Filosofía fundamental de la arquitectura: La simplicidad es mejor que la complejidad. Los arreglos complejos a menudo no solo son inútiles, sino también perjudiciales. 1. El agente es superior al flujo de trabajo. Idea errónea: En sus inicios, la industria popularizó el uso de gráficos o flujos de trabajo predefinidos para controlar la IA, creyendo que esto la haría más controlable. • Realidad: Este enfoque es extremadamente frágil al abordar tareas abiertas. Una vez que la IA se desvía de la ruta preestablecida, no solo no logra corregirse, sino que también pierde el contexto. Conclusión: La arquitectura actual vuelve a un bucle único. El LLM se ejecuta, verifica y autocorrige continuamente dentro de este bucle hasta que se completa la tarea. 2. Un bucle de entidad única es superior a un subagente. Error: A muchos les gusta diseñar arquitecturas complejas de "subagentes". Realidad: Cada capa adicional de abstracción y especialización conlleva una pérdida significativa de contexto. El modelo necesita información global completa para tomar decisiones óptimas. Conclusión: Un solo circuito LLM con un conjunto de herramientas simple a menudo funciona de manera más inteligente y eficaz que un grupo de subagentes, cada uno con su propia función. II. Implementación táctica clave: Permitir que el modelo se enfoque y comprenda Dos técnicas de "microgestión" extremadamente prácticas: 1. La lista de tareas es un superpoder. Para evitar que el agente se pierda en tareas largas, introdujeron una herramienta aparentemente redundante llamada todo_write. En realidad, se trata de una "cadena mental" reforzada. El agente actualiza esta lista después de cada paso, lo que lo obliga a reforzar continuamente el siguiente objetivo, mejorando considerablemente la tasa de finalización de la tarea. 2. El contexto es clave. Las preguntas de los usuarios suelen ser ambiguas (por ejemplo, errores ortográficos o terminología interna). Sin conocimiento del contexto, la IA no puede comprenderlas correctamente. Tomaron prestado el enfoque de Claude Code e introdujeron el comando `/init`. Mediante búsquedas y análisis web, crearon una memoria a nivel de proyecto para el agente, lo que permitió que la IA comprendiera realmente el negocio del usuario. III. Errores del desarrollo: Atención a dos advertencias muy claras: los marcos y la evaluación son pura teoría. 1. Rechazar la dependencia excesiva de los frameworks. Declararon explícitamente que lamentaban haber usado LangChain y LangGraph. Los modelos de IA iteran con extrema rapidez, y los frameworks pesados a menudo no pueden seguir el ritmo de los cambios, convirtiéndose en una carga. Sugieren mantener el código a bajo nivel, ya que llamar directamente a las API suele ser el enfoque más flexible y sostenible. 2. Las evaluaciones no son la panacea. Si bien los conjuntos de pruebas son importantes, las complejidades del mundo real (datos sucios, rutas de usuario extrañas) superan con creces la cobertura de los conjuntos de pruebas. Destacaron la importancia de la "Hora de Seguimiento" (revisión humana periódica de registros del mundo real). Comprender cómo interactúan los usuarios reales con la IA es más valioso que ejecutar un conjunto de pruebas perfecto. IV. Experiencia del producto y estrategia del modelo 1. Muestre el proceso completo. No intente presentar la IA como una caja negra perfecta. Los usuarios confían más en la IA "transparente". PostHog AI elige mostrar todas las llamadas a herramientas, los procesos de razonamiento e incluso los intentos fallidos. Esta experiencia de "caja blanca" genera confianza en el usuario y facilita la identificación de problemas. 2. Aprovechar el crecimiento del modelo: La versión actual es: Claude Sonnet 4.5 para el bucle principal y OpenAI o4-mini para la inferencia y la generación de consultas complejas. Sin embargo, los desarrolladores deben estar siempre preparados para el siguiente modelo, más potente. Resumir La experiencia de PostHog durante el último año se puede resumir así: separar el trigo de la paja. Abandonaron la aparentemente sofisticada, pero en realidad engorrosa, "colaboración multiagente", la "orquestación compleja de grafos" y los "marcos de desarrollo complejos" de las primeras etapas del desarrollo de IA, volviendo a la arquitectura más simple de bucle único. Al dotar al modelo de memorias más claras (tareas pendientes), un contexto más rico e interacciones más transparentes, crearon un asistente de IA verdaderamente eficaz. Dirección del blog

Hilo de meng shao (@shao__meng)

Información del autor

Contenido del hilo