Lanzamiento de Claude Opus 4.5: el modelo de uso de computadora, agente y codificación más poderoso; el uso de tokens se redujo significativamente; el precio es 1/3 del de Opus 4.1; el puntaje verificado de SWE-bench supera los 80 puntos por primera vez. Avance en el rendimiento de las habilidades de programación: Obtuvo una puntuación del 80,9 % en la prueba verificada de SWE-bench, superando a Google Gemini 3 Pro (76,2 %) y a OpenAI GPT-5.1-Codex-Max (77,9 %). Aún más impresionante, en las pruebas internas de ingeniería de rendimiento de Anthropic, Opus 4.5 superó a todos los solicitantes humanos. • Capacidades del agente: Se obtuvo una puntuación del 66,3 % en la prueba de uso de computadoras de OSWorld, lo que demuestra un sólido comportamiento orientado a objetivos a largo plazo. Los evaluadores internos informaron que Opus 4.5 puede gestionar tareas que Sonnet 4.5 no podía completar hace unas semanas y puede encontrar soluciones de forma autónoma ante errores complejos en múltiples sistemas. • Mejora de la eficiencia: Esta es una mejora significativa. Al gestionar tareas de codificación de larga duración, Opus 4.5 utiliza hasta un 65 % menos de tokens, manteniendo o mejorando la calidad de salida. Esto se traduce en menores costos y tiempos de respuesta más rápidos. La revolución de precios establece el precio en $5 por millón de tokens de entrada y $25 por millón de tokens de salida, una reducción de dos tercios en comparación con los $15/$75 de la versión anterior de Opus 4.1. Esto hace que las capacidades de nivel Opus sean asequibles por primera vez, lo que le permite convertirse en un modelo principal para el uso diario. Actualización del producto disponible en múltiples plataformas: Opus 4.5 ya está disponible en las aplicaciones y API de Claude, así como en tres plataformas de nube principales: Amazon Bedrock, Google Cloud Vertex AI y Microsoft Azure. Los desarrolladores pueden invocarlo mediante el identificador de modelo claude-opus-4-5-20251101. Innovación tecnológica · Inferencia híbrida: Opus 4.5 admite los modos de respuesta instantánea y pensamiento extendido. Los usuarios de la API pueden controlar con precisión la cantidad de cómputo que el modelo invierte en la respuesta mediante el parámetro de esfuerzo para lograr un equilibrio entre rendimiento, latencia y coste. • Gestión de memoria mejorada: se han realizado mejoras significativas en la gestión de memoria para operaciones de contexto largas, lo que lo hace particularmente adecuado para escenarios de agentes: Opus puede actuar como agente maestro para comandar un grupo de subagentes controlados por Haiku. • Seguridad mejorada: el modelo es más resistente a los ataques de inyección de señales y exhibe una menor tasa de comportamiento problemático en la evaluación de desalineación, lo que lo convierte en la versión más segura de Anthropic hasta la fecha. Posicionamiento en el mercado Opus 4.5 está diseñado principalmente para profesionales del conocimiento, como ingenieros de software profesionales, analistas financieros, consultores y contadores, así como para escenarios que requieren la gestión de tareas empresariales complejas y flujos de trabajo intensivos de agentes inteligentes. Este modelo de gama alta es ideal para escenarios donde los modelos anteriores no podían resolver el problema y el rendimiento era crítico. Impacto en la industria: Este lanzamiento llega en un momento de intensa competencia en la industria de la IA. Gemini 3 de Google, apenas una semana después de su lanzamiento, ya ha causado sensación en el mercado, e incluso el CEO de Salesforce ha declarado que cambiará de ChatGPT a Gemini. El lanzamiento de Opus 4.5 demuestra la determinación y la fuerza de Anthropic para mantener su liderazgo en esta carrera.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
