¿Quién recuerda cuando Karpathy estudiaba ImageNet manualmente? La inspección manual de las entradas de los modelos sigue teniendo una gran ventaja, sobre todo hoy en día con LLMS/Agentes. Ayuda a desarrollar la intuición y, por lo tanto, a diseñar mejores agentes. Actualmente, las entradas de los agentes son enormes conjuntos de instrucciones del sistema, definiciones de herramientas, entradas/salidas de herramientas, razonamiento, mensajes de usuario y salidas de agentes, todo ello mezclado. @HamelHusain, me suena a "mira tus datos". Si de verdad leyeras todo eso, ¿entenderías qué demonios estaba pasando? Pero puedes ayudar al modelo a ayudarte si tienes sistemas que preparen bien la entrada (ingeniería de contexto). Las mejores intuiciones sobre los modos de fallo suelen surgir al leer directamente los registros. Hoy en día, los agentes pueden ayudarte a analizar la enorme cantidad de datos generados en las distintas ejecuciones. Pero ten en cuenta que los humanos son excelentes evaluadores en los dominios que conocen bien, mientras que los agentes son excelentes para encontrar patrones en grandes volúmenes de datos: una combinación perfecta. Quiero saber cuánto trabajo manual sienten que realizan los agentes de construcción y cuánto creen que les ayuda.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.