X (Twitter)

Un análisis profundo de "Claude Agent Skills" desde los primeros principios La explicación y el análisis de @HanchungLee sobre las Habilidades del Agente de Claude son muy completos y se ajustan estrictamente a los principios subyacentes. Recomiendo encarecidamente guardarlo y leerlo. Partiendo de los principios básicos, el autor analiza a fondo la filosofía de diseño del sistema, la estructura de archivos, el mecanismo de descubrimiento, el proceso de invocación y las diferencias fundamentales con las herramientas tradicionales. 1. ¿Qué hace exactamente el sistema de habilidades? En pocas palabras, las "habilidades" de Claude no son llamadas a funciones tradicionales ni herramientas de ejecución de código, sino un sistema de metaherramientas basado exclusivamente en indicaciones. Al inyectar dinámicamente una instrucción a nivel de sistema cuidadosamente diseñada en la conversación actual, se altera temporalmente el comportamiento de Claude, el conjunto de herramientas disponible e incluso el modelo predeterminado, lo que permite que la misma instancia de Claude se transforme en un experto en el dominio o ejecute flujos de trabajo complejos específicos. La idea central se puede resumir en una frase: Habilidades = "Conocimientos profesionales que se pueden inyectar a demanda + permisos de herramientas preautorizados + pautas claras de ejecución de tareas". II. La diferencia fundamental entre habilidades y herramientas tradicionales Las herramientas tradicionales (como Bash, Read, Write, Computer Use) son operaciones atómicas que se ejecutan sincrónicamente: el modelo emite una llamada → el sistema externo devuelve inmediatamente el resultado → el modelo continúa pensando. Las habilidades son completamente diferentes: No ejecuta directamente ningún código ni comando externo. Su función es reescribir el contexto: una vez invocado, inserta una nueva instrucción de máxima prioridad en el diálogo. Es esencialmente un extensor de pistas asíncrono. Después de la llamada, todo el pensamiento posterior y el uso de herramientas por parte de Claude deben cumplir con este nuevo conjunto de reglas de inyección. Es por esto que las habilidades son naturalmente adecuadas para manejar flujos de trabajo que requieren razonamiento de múltiples pasos, gestión de estados y conocimiento del dominio, mientras que las herramientas tradicionales son más adecuadas para acciones individuales como "obtener datos" y "escribir archivos". 3. ¿Cómo se ve una habilidad? Una habilidad completa es una carpeta, con un solo archivo principal: https://t.co/JW8wM9KmBn. Una estructura típica es la siguiente: mi-experto-en-pdf/ ├── SKILL.md ← El archivo más importante ├── scripts/ ← Opcional, contiene scripts auxiliares de Python/js ├── references/ ← Opcional, contiene documentación para que el modelo lea └── assets/ ← Opcional, contiene plantillas, binarios, etc., donde solo se proporciona la ruta SKILL.md se divide en dos partes: 1. Metadatos YAML al principio (entre ---) --- nombre: pdf Descripción: Eres un experto profesional en procesamiento de PDF que puede extraer, convertir y analizar contenido PDF. herramientas permitidas: "Bash, Leer, Escribir" modelo: claude-opus-4-20250514 Versión: 1.2.0 --- Explicación de los campos clave: • nombre: el nombre del comando en el que se invoca la habilidad (el usuario diría: "Procesar este archivo usando la habilidad pdf"). • Descripción: ¡Lo más importante! Claude decide cuándo invocar cada habilidad leyendo las descripciones de todas las habilidades, por lo que debe ser concisa y orientada a la acción. • Herramientas permitidas: Una lista de herramientas preautorizadas que admiten comodines (p. ej., Bash(pdftotext:*)) e implementan el principio de mínimo privilegio. • Modelo: Permite forzar el uso de modelos más robustos (p. ej., Opus 4). 2. Después de YAML se encuentran instrucciones detalladas escritas en Markdown puro, que generalmente incluyen: objetivos de la tarea, condiciones previas, pasos detallados, especificaciones de formato de salida, estrategias de manejo de errores, ejemplos específicos y cómo usar recursos en scripts y activos. Estilo de escritura recomendado: utilice oraciones imperativas, numere los pasos y especifique la ruta de cita (por ejemplo, Read({baseDir}/scripts/extract_text.py)) y mantenga la longitud total dentro de las 5000 palabras. IV. ¿Cómo se descubren y utilizan las habilidades? Claude tiene una metaherramienta interna llamada "Habilidad" que es específicamente responsable de generar dinámicamente una lista de todas las habilidades disponibles en el entorno actual. El proceso es el siguiente: 1. Al iniciarse, Claude escanea todas las carpetas de habilidades y lee el encabezado YAML de cada archivo SKILL.md. 2. Empaquete estas habilidades en una lista XML estructurada y colóquela en las indicaciones del sistema. 3. Cuando un usuario realiza una solicitud, Claude se basa completamente en la comprensión del lenguaje natural para seleccionar la habilidad más adecuada de la descripción. 4. Emita una llamada a una herramienta similar a Skill({"command": "pdf"}). 5. Después de verificar los permisos, la metaherramienta Skill inyecta el contenido Markdown completo de la habilidad correspondiente en el diálogo como usuario (pero marcado con isMeta: true). 6. Inyecte simultáneamente un mensaje breve y visible (isMeta: false) para indicar al usuario "Habilitando habilidades de experto en PDF..." V. ¿Por qué se denomina a esta la “arquitectura de agente inteligente complejo más segura”? 1. Falta de privilegios de ejecución de código: toda la lógica es deducida y completada en última instancia por el propio Claude. 2. Los permisos de las herramientas se pueden controlar con precisión: las habilidades se pueden preautorizar solo para unos pocos comandos, como pdftotext y grep. 3. Basado puramente en indicaciones: incluso si la habilidad está escrita incorrectamente, solo hará que el modelo se comporte de manera torpe y no provocará un incidente de seguridad. 4. Admite actualizaciones en caliente: agrega una nueva habilidad a una carpeta y estará disponible inmediatamente en la próxima conversación sin necesidad de reiniciar. VI. Caso práctico: La parte más convincente del artículo sobre la habilidad creadora de habilidades demuestra cómo una habilidad crea otra habilidad mediante la habilidad creadora de habilidades. Implementa un asistente completo de cinco pasos: 1. Comprender los requisitos → 2. Desarrollar un plan → 3. Inicializar la carpeta y SKILL.md → 4. Permitir a los usuarios editar y refinar → 5. Empaquetar y verificar Todo el proceso se completa dentro de Claude, solo llamando a las plantillas de Python en los scripts cuando es necesario, lo que demuestra las sorprendentes capacidades de autoarranque del sistema de habilidades. Resumen: Perspectivas fundamentales sobre el sistema de habilidades 1. El conocimiento profesional no se aprende a través de modelos, sino que se nos “inyecta”. 2. Los agentes inteligentes complejos no necesariamente necesitan ReAct + llamadas de función; las sugerencias puras + la reescritura del contexto son igualmente poderosas. 3. La seguridad y la capacidad no son mutuamente excluyentes: mediante herramientas preautorizadas e instrucciones claras, Claude puede manejar tareas altamente complejas del mundo real manteniendo un control total. Dirección del blog:

Hilo de meng shao (@shao__meng)

Información del autor

Contenido del hilo