X (Twitter)

Uma análise profunda das "Habilidades do Agente Claude" a partir dos princípios básicos. A explicação e análise de @HanchungLee sobre as habilidades do Claude Agent é muito abrangente e segue de perto os princípios subjacentes. Recomendo fortemente que você salve e leia. Partindo dos princípios básicos, o autor disseca minuciosamente a filosofia de design do sistema, a estrutura de arquivos, o mecanismo de descoberta, o processo de invocação e as diferenças fundamentais em relação às ferramentas tradicionais. 1. O que exatamente o sistema de habilidades faz? Em termos simples, as "habilidades" de Claude não são chamadas de função tradicionais ou ferramentas de execução de código, mas sim um sistema de metaferramentas baseado puramente em prompts. Ao injetar dinamicamente uma instrução de sistema cuidadosamente projetada na conversa atual, ele altera temporariamente o comportamento de Claude, o conjunto de ferramentas disponíveis e até mesmo o modelo padrão, permitindo que a mesma instância de Claude se "transforme" em um especialista no domínio ou execute fluxos de trabalho complexos específicos. A ideia central pode ser resumida em uma frase: Habilidades = "Conhecimento profissional que pode ser aplicado sob demanda + permissões de ferramentas pré-autorizadas + diretrizes claras para a execução de tarefas". II. A diferença fundamental entre habilidades e ferramentas tradicionais. As ferramentas tradicionais (como Bash, Read, Write, Computer Use) são operações atômicas que são executadas de forma síncrona: o modelo emite uma chamada → o sistema externo retorna imediatamente o resultado → o modelo continua a pensar. As habilidades são completamente diferentes: Não executa diretamente nenhum código ou comando externo. Sua função é "reescrever o contexto": uma vez invocado, insere uma nova instrução de prioridade máxima no diálogo. É essencialmente um "extensor de dicas" assíncrono. Após a chamada, todo o raciocínio e uso de ferramentas subsequentes por parte de Claude devem obedecer a esse novo conjunto de regras de injeção. É por isso que as habilidades são naturalmente adequadas para lidar com fluxos de trabalho que exigem raciocínio em várias etapas, gerenciamento de estado e conhecimento do domínio, enquanto as ferramentas tradicionais são mais adequadas para ações únicas, como "obter dados" e "gravar arquivos". 3. Como se manifesta uma habilidade? Uma skill completa é uma pasta, com apenas um arquivo principal: https://t.co/JW8wM9KmBn. Uma estrutura típica é a seguinte: meu-especialista-em-pdf/ ├── SKILL.md ← O arquivo mais importante ├── scripts/ ← Opcional, contém scripts auxiliares em Python/JS ├── references/ ← Opcional, contém a documentação do modelo └── assets/ ← Opcional, contém modelos, binários, etc., onde apenas o caminho é fornecido O arquivo SKILL.md está dividido em duas partes: 1. Metadados YAML no início (envolvidos em ---) --- nome: pdf Descrição: Você é um especialista profissional em processamento de PDFs, capaz de extrair, converter e analisar conteúdo de PDFs. ferramentas-permitidas: "Bash, Leitura, Escrita" modelo: claude-opus-4-20250514 Versão: 1.2.0 --- Explicação dos campos principais: • nome: O nome do comando que invoca a habilidade (o usuário diria: "Processar este arquivo usando a habilidade pdf"). • Descrição: Muito importante! Claude decide quando invocar qual habilidade lendo as descrições de todas as habilidades, portanto, ela deve ser concisa e orientada à ação. • Ferramentas permitidas: Uma lista de ferramentas pré-autorizadas, com suporte a curingas (por exemplo, Bash(pdftotext:*)), implementando o princípio do menor privilégio. • Modelo: Permite forçar o uso de modelos mais robustos (por exemplo, Opus 4). 2. Após o YAML, seguem-se instruções detalhadas escritas em Markdown puro, que normalmente incluem: objetivos da tarefa, pré-condições, etapas detalhadas, especificações do formato de saída, estratégias de tratamento de erros, exemplos específicos e como usar recursos em scripts e ativos. Estilo de escrita recomendado: Use frases imperativas, numere as etapas e especifique o caminho da citação (por exemplo, Read({baseDir}/scripts/extract_text.py)), e mantenha o comprimento total em até 5000 palavras. IV. Como as habilidades são descobertas e utilizadas? Claude possui uma metaferramenta interna chamada "Skill" que é especificamente responsável por gerar dinamicamente uma lista de todas as habilidades disponíveis no ambiente atual. O processo é o seguinte: 1. Ao iniciar, Claude examina todas as pastas de habilidades e lê o cabeçalho YAML de cada arquivo SKILL.md. 2. Agrupe essas habilidades em uma lista XML estruturada e insira-a nos prompts do sistema. 3. Quando um usuário faz uma solicitação, Claude se baseia inteiramente na compreensão da linguagem natural para selecionar a habilidade mais adequada a partir da descrição. 4. Emita uma chamada de ferramenta semelhante a Skill({"command": "pdf"}). 5. Após verificar as permissões, a ferramenta de metadados Skill insere o conteúdo Markdown completo da habilidade correspondente na caixa de diálogo como um usuário (mas marcado com isMeta: true). 6. Insira simultaneamente uma mensagem curta e visível (isMeta: false) para informar ao usuário "Habilitando habilidades de especialista em PDF..." V. Por que isso é chamado de "arquitetura de agente inteligente complexo mais segura"? 1. Ausência de privilégios de execução de código: Toda a lógica é, em última análise, deduzida e concluída pelo próprio Claude. 2. As permissões das ferramentas podem ser controladas com precisão: as habilidades podem ser pré-autorizadas apenas para alguns comandos, como pdftotext e grep. 3. Puramente guiado por instruções: Mesmo que a habilidade esteja escrita incorretamente, isso apenas fará com que o modelo se comporte de forma desajeitada e não causará um incidente de segurança. 4. Suporta atualizações instantâneas: Adicione uma nova habilidade a uma pasta e ela estará disponível imediatamente na próxima conversa, sem necessidade de reiniciar. VI. Estudo de Caso Real: A parte mais convincente do artigo sobre a própria habilidade criadora de habilidades demonstra "como uma habilidade cria outra habilidade" usando a habilidade criadora de habilidades. Ela implementa um assistente completo de cinco etapas: 1. Compreender os requisitos → 2. Desenvolver um plano → 3. Inicializar a pasta e o arquivo SKILL.md → 4. Permitir que os usuários editem e refinem → 5. Empacotar e verificar Todo o processo é concluído dentro do Claude, chamando modelos Python em scripts apenas quando necessário, demonstrando as incríveis capacidades de auto-inicialização do sistema de habilidades. Resumo: Principais percepções sobre o sistema de habilidades 1. O conhecimento profissional não é aprendido por meio de modelos, mas sim "injetado" em nós. 2. Agentes inteligentes complexos não precisam necessariamente de ReAct + chamadas de função; dicas puras + reescrita de contexto são igualmente poderosas. 3. Segurança e capacidade não são mutuamente exclusivas: por meio de ferramentas pré-autorizadas e instruções claras, Claude pode lidar com tarefas complexas do mundo real, mantendo o controle total. Endereço do blog:

Thread de meng shao (@shao__meng)

Informações do autor

Conteúdo da thread