No cree agentes, cree habilidades En su discurso de apertura en la Cumbre de Código @aiDotEngineer, Anthropic @barry_zyj y @maheshmurag analizaron la siguiente etapa clave en el desarrollo de agentes de IA: pasar de simplemente perseguir la arquitectura de "Agentes" a dotarlos de "Habilidades" específicas y reutilizables. Punto clave: Alto coeficiente intelectual vs. experiencia profesional Una de las principales contradicciones que enfrentan los agentes de IA es que tienen inteligencia pero carecen de experiencia. • Metáfora: Utilizaron una metáfora muy vívida: "Mahesh (un genio de las matemáticas con un coeficiente intelectual de 300)" frente a "Barry (un experto en impuestos experimentado)". Situación actual: El agente actual de modelos a gran escala es como ese genio matemático. Si bien es extremadamente inteligente y tiene la capacidad de deducir principios complejos desde cero, si se le pide que presente impuestos, podría resultar ineficiente o tener pérdidas debido a la falta de códigos tributarios específicos y conocimiento de procesos. • Necesidad: En escenarios de trabajo del mundo real, a menudo necesitamos un "experto en impuestos", es decir, una persona que pueda ejecutar de manera confiable procesos de dominio específico y posea conocimiento de procedimiento, en lugar de un genio que tenga que repensar las cosas desde los primeros principios cada vez. Solución: ¿Qué son las “Habilidades”? Para superar esta brecha, Anthropic introdujo el concepto de “Habilidades”. • Definición: Las habilidades son las unidades más pequeñas que contienen el conocimiento procedimental, y los agentes pueden cargar dinámicamente estas unidades según sea necesario. • Formato: Es muy ligero. Una habilidad puede ser simplemente una carpeta que contiene scripts (como herramientas) y archivos de instrucciones principales (generalmente en formato Markdown). Características: • Portátil: Se puede compartir entre diferentes agentes. • Componible: al igual que los bloques Lego, puedes combinar diferentes habilidades para otorgarle instantáneamente a un agente general experiencia entre dominios. • Baja barrera de entrada: su esencia no es la ingeniería de código compleja, sino una descripción clara y una encapsulación de herramientas de "cómo hacer algo". Visión: De "Agentes de Construcción" a "Acumulación de Conocimiento" Esta presentación no fue sólo sobre tecnología; fue sobre pensamiento estratégico sobre cómo las organizaciones pueden aprovechar la IA. • La evolución de las bases de conocimiento empresariales: La ventaja competitiva de las empresas del futuro reside en quiénes pueden construir una base de habilidades en constante evolución. Estas habilidades son definidas por expertos dentro de la empresa y se optimizan continuamente con base en la retroalimentación del uso de los agentes. • Autoevolución del Agente: La presentación presentó una visión emocionante del futuro: los agentes no solo serán usuarios de habilidades, sino que eventualmente se convertirán en creadores de habilidades. Podrán aprender de su trabajo, desarrollar nuevas habilidades y, por lo tanto, lograr la autoevolución. • Agente unificado: No es necesario entrenar ni perfeccionar un nuevo modelo por separado para cada tarea. En su lugar, se mantiene un agente general y potente que puede cambiar de rol instantáneamente al cargar diferentes habilidades (por ejemplo, un analista de documentos en un segundo y un revisor de código al siguiente). El mensaje más importante que transmite este video es: no te obsesiones con las "arquitecturas de agentes complejas", sino concentra tu energía en refinar y encapsular "conocimientos profesionales" específicos. Para los desarrolladores y las empresas, esto significa comenzar a pensar en cómo transformar el "conocimiento tácito" dentro de su equipo en "habilidades" estandarizadas, para que la IA pueda convertirse realmente en un experto con conocimientos de negocios, en lugar de solo un asistente inteligente y de propósito general. Vídeo de YouTube
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
