Soy un gran admirador del diseño iterativo de arneses con interacción humano-agente, impulsado por evaluaciones. Ejemplo de flujo de trabajo: 1. Crear un entorno de agente básico (digamos, para simplificar, indicaciones y herramientas). 2. Ejecuta tu agente en un conjunto de evaluaciones y recopila los registros. Probablemente se trate de una gran cantidad de datos que cualquier persona podría analizar; usa agentes como ayuda, pero guíalos adecuadamente. 3. «Extracción de datos»: Utilice otro agente evaluador para analizar esos rastros; tenga claro qué busca. Algunos patrones interesantes incluyen la estratificación de rastros para encontrar patrones repetitivos, el cálculo de estadísticas sobre fallos en las llamadas a herramientas, etc. 4. Perfecciona las herramientas y las indicaciones de esta ronda de minería de datos. Ahora que tienes los datos, guía la siguiente revisión. Esto indica claramente qué funciona y qué no. 5. Repetir hasta alcanzar la saturación o hasta que esté satisfecho. Opcionalmente, ejecutar este proceso en paralelo en diferentes arneses y modelos. Esto potencia las mejores cualidades de humanos y agentes. Los agentes son excepcionales en el reconocimiento de patrones y pueden procesar grandes cantidades de datos rápidamente. Los humanos poseen intuición y conocimientos especializados para guiar el proceso de actualización del sistema. Las evaluaciones nos proporcionan una métrica para la optimización.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.