X (Twitter)

A busca por agentes recebe muita atenção, e com razão, mas grande parte do seu valor e dos problemas igualmente interessantes em larga escala reside na criação de índices (por agentes). Ou seja, organizar os dados (tags, embeddings, clusters) para que um bom processo de busca possa até mesmo encontrar o resultado correto. É mágico quando você envia um ping para o Parallel ou o Exa e o agente deles retorna o conteúdo para o nosso agente de forma impecável. Mas antes disso, eles fazem uma grande quantidade de marcação de dados (o que permite filtrar por palavras-chave), otimizam os embeddings (que estão em alta novamente?), indexam de forma eficiente para maior velocidade e criam uma boa estratégia de busca híbrida. É preciso muito trabalho minucioso para tornar algo pesquisável. Essa nova onda de ferramentas de busca local, como o "grep", tenta aliviar o usuário da carga de indexação. Sou totalmente a favor de melhores ferramentas de busca, então se elas funcionarem com nosso código local, melhor ainda. Indexar código dinamicamente e expor buscas híbridas/agentes sobre ele é difícil, com muitas pequenas escolhas de design envolvidas, mas se for melhor do que o grep/glob normal por uma certa margem, isso significa que nossos agentes terão um contexto melhor —> uma troca de valor enorme.

Thread de Viv (@Vtrivedy10)

Informações do autor

Conteúdo da thread