X (Twitter)

[Interpretação do Blog do Projeto Antrópico] Recursos avançados de uso de ferramentas: A combinação de três tecnologias — ferramenta de busca de ferramentas, invocação programática de ferramentas e exemplos de uso de ferramentas — reduz significativamente o consumo de tokens, torna a seleção de ferramentas mais clara e torna as invocações complexas mais precisas. A Anthropic lançou recentemente o uso avançado de ferramentas na plataforma de desenvolvimento Claude, permitindo que agentes de IA lidem com centenas ou até milhares de ferramentas de forma eficiente, sem serem limitados por janelas de contexto. Imagine um agente precisando operar IDEs, Git, Slack, GitHub, Jira ou bancos de dados simultaneamente — tradicionalmente, as definições de ferramentas consomem uma quantidade enorme de tokens, levando ao inchaço do contexto, seleção incorreta de ferramentas ou atrasos na invocação. Esses novos recursos melhoram significativamente a usabilidade e a escalabilidade do agente por meio de carregamento dinâmico, orquestração de código e orientação por exemplos. https://t.co/RiM4CuLtgp Principais desafios e estratégias de enfrentamento: A construção de um sistema confiável para o uso de ferramentas enfrenta três grandes dificuldades: Em primeiro lugar, o consumo de tokens é muito alto — por exemplo, obter definições de ferramentas de vários serviços (como GitHub e Slack) pode consumir instantaneamente mais de 50.000 tokens. Em segundo lugar, a escolha das ferramentas é imprecisa — ferramentas com nomes semelhantes (como notification-send-user e notification-send-channel) são facilmente confundidas. Em terceiro lugar, o padrão de chamada é ambíguo — embora o padrão JSON padronize os parâmetros, ele não consegue exibir intuitivamente formatos complexos, como datas ou objetos aninhados. A estratégia da Anthropic é "atraso e inteligência": em vez de carregar todas as ferramentas de uma só vez, ela as descobre e as invoca sob demanda; usa código em vez de linguagem natural para coordenar operações de várias etapas, reduzindo as rodadas de inferência; e esclarece o uso por meio de exemplos. Esses métodos essencialmente mudam o uso das ferramentas da descrição estática para a execução dinâmica, ajudando os agentes a implementar fluxos de trabalho complexos em ambientes com recursos limitados. Três tecnologias-chave 1. Ferramenta de Busca Esta é uma "metaferramenta" que permite aos agentes pesquisar e carregar ferramentas relevantes em tempo de execução, em vez de pré-carregar todas as definições. Quando o parâmetro `defer_loading: true` está definido, apenas as ferramentas pesquisadas e algumas ferramentas principais entram no contexto inicial. Os agentes podem buscar ferramentas dinamicamente por nome ou descrição; por exemplo, ao consultar tarefas do GitHub, apenas `github.createPullRequest` é carregado. Vantagens: Economia de tokens de até 85% (de 77 mil para 8,7 mil) e melhorias significativas na precisão (por exemplo, Claude Opus 4 de 49% para 74%). Implementação simples: O suporte para carregamento lento em lote do MCP é obtido adicionando uma configuração de busca ao array de ferramentas. Isso permite que os agentes naveguem com eficiência por uma grande biblioteca de ferramentas, funcionando como um "índice inteligente". 2. Chamada de Ferramenta Programática Em vez de chamar as ferramentas uma a uma em linguagem natural, o agente gera código Python para realizar a coordenação de múltiplas ferramentas em um ambiente de sandbox. As ferramentas precisam ser marcadas com allowed_callers: ["code_execution_20250825"], e Claude gera trechos de código contendo loops, condicionais e execução paralela (como asyncio.gather). Exemplo: Ao verificar estouros de orçamento, o código pode recuperar dados de membros da equipe, orçamento e despesas em paralelo, e retornar apenas o resultado final (como uma lista de estouros) para o agente, evitando que dados intermediários poluam o contexto. Vantagens: Redução de 37% na contagem de tokens (de 43.588 para 27.297), redução da latência (sem necessidade de múltiplas rodadas de inferência) e aumento da precisão de 25,6% para 28,5% em tarefas de recuperação de conhecimento. Isso é particularmente adequado para lidar com tabelas grandes ou links de API, como a análise de dados em lote no Claude para Excel. 3. Exemplos de uso de ferramentas Complemente o padrão JSON fornecendo exemplos de entrada para demonstrar os padrões de chamada reais. Por exemplo, na ferramenta `create_ticket`, liste o formato de data (AAAA-MM-DD), objetos aninhados (como `reporter`) e parâmetros opcionais (para atualizações de emergência). Cada ferramenta pode incluir de 2 a 3 exemplos de variantes. Vantagens: A precisão com parâmetros complexos aumenta de 72% para 90%, especialmente com formatos de ID ou associações de parâmetros. É como dar ao agente um "manual do usuário", permitindo que ele compreenda rapidamente as regras implícitas. Resultados experimentais e perspectivas: Testes internos de benchmark mostram melhorias nessas funcionalidades nos benchmarks MCP e GIA: a retenção de contexto atinge 85% e a precisão geral melhora em média de 10 a 20%. Por exemplo, ao lidar com grandes conjuntos de ferramentas, o desempenho do Claude Opus 4.5 aumenta de 79,5% para 88,1%. Em aplicações práticas, ele já permitiu que agentes se integrassem perfeitamente a cenários como Excel ou Jira.

Thread de meng shao (@shao__meng)

Informações do autor

Conteúdo da thread