Todo mundo tem um slide favorito de um relatório sobre o Estado de ___, este é o meu! Observabilidade → Avaliações → Melhoria basicamente: 1. Observabilidade: queremos melhorar nossos agentes... então precisamos saber o que eles estão realmente fazendo. Registrar tudo é uma boa prática padrão; se não for útil, você pode excluir depois, mas pelo menos você PODE inspecionar. 2. Avaliações: temos tarefas importantes para nós; devemos testar nosso agente nelas e expandi-las à medida que recebermos mais feedback. 3. Aprimoramento: Temos essas máquinas mágicas que podem processar toneladas de dados e identificar padrões no que está acontecendo; devemos usá-las em nossos dados para descobrir como aprimorar nossos prompts, habilidades, subagentes… Minha missão (caso eu a aceite, o que já fiz): reduzir esses 29,4% a 0. Eu costumava (e ainda sou, em certa medida) muito guiado pela intuição ao programar e aprimorar agentes. Tipo, simplesmente usar, sentir a vibe e experimentar coisas. Mas o padrão de analisar rastros de agentes com um agente para aprimorá-lo também é bom... na verdade, é ótimo. “Analise seus dados” - @HamelHusain “Não se esqueça de armazenar seus dados para que você possa consultá-los” - eu Além disso, o restante deste relatório contém várias informações interessantes, como, por exemplo, para que as pessoas realmente usam os agentes.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.