O guia oficial da Anthropic, "Como construir agentes de IA mais eficientes por meio de execução de código + MCP", reduz o consumo de tokens de 150.000 para 2.000, economizando 98% de tempo e custo. Com o crescente número de ferramentas de conexão, o método de invocação direta de ferramentas acarreta problemas como consumo excessivo de tokens e redução da eficiência do agente. A ideia central é tratar o servidor MCP como uma API de código, e não como uma chamada direta de ferramenta, permitindo que os agentes escrevam código para interagir com o servidor MCP. Isso pode aumentar a eficiência contextual de agentes inteligentes, reduzir custos e latência, além de melhorar a capacidade desses agentes de lidar com tarefas complexas, protegendo também a privacidade. O mecanismo de descoberta de ferramentas organiza as ferramentas do MCP em uma estrutura de sistema de arquivos, como servidores/google-drive/getDocument.ts. Os agentes podem explorar o sistema de arquivos para descobrir e carregar as definições de ferramentas necessárias sob demanda, sem precisar carregar todas as ferramentas de uma só vez. Na orquestração de código, o agente não chama mais a ferramenta diretamente, mas gera um trecho de código, como TypeScript. Esse código chama funções pré-configuradas para interagir com a ferramenta MCP. Por exemplo, a tarefa de "baixar anotações de reunião do Google Drive e anexá-las a leads do Salesforce" é transformada em um código que inclui chamadas para gdrive.getDocument() e salesforce.updateRecord(). Em termos de proteção de privacidade, os resultados intermediários são retidos no ambiente de execução por padrão, e somente os dados que são explicitamente registrados ou retornados entrarão no contexto do modelo. Para dados sensíveis, como Informações de Identificação Pessoal (PII), o cliente MCP pode desidentificar os dados antes que cheguem ao modelo e, em seguida, desidentificá-los novamente quando necessário, garantindo que as informações sensíveis nunca sejam expostas diretamente ao modelo. #MCP #Agente de IA
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
