X (Twitter)

Aquí están mis pensamientos sobre Opus 4.5 después de ~2 semanas de uso. Primero algunas reflexiones generales, luego algunas cosas prácticas. --- EL CUADRO COMPLETO --- EL DESBLOQUEO PARA AGENTES Para cualquiera que haya utilizado Opus 4.5 está claro que el progreso de la IA no se está desacelerando. Me sorprende que más gente no le dé importancia a esto. Sospecho que el lanzamiento justo antes del Día de Acción de Gracias, sumado a la participación de todos en NeurIPS esta semana, ha retrasado el debate al respecto dos semanas. Pero este es el mejor modelo tanto para el código como para los agentes, y no se acerca. Se ha hecho la analogía de que este es otro momento de 3.5 Sonetos, y estoy de acuerdo. Pero ¿qué significa eso? Cada pocas generaciones, recibimos un importante lanzamiento de modelo: un momento que abre las puertas a una nueva forma de trabajar. GPT-4 fue el lanzamiento del chat, Sonnet 3.5 fue el lanzamiento del código, y ahora Opus 4.5 es el lanzamiento para los agentes. Gracias a Opus 4.5, los agentes ahora pueden trabajar de forma fiable en horizontes temporales cada vez más amplios y realizar tareas reales en su nombre. Opus 4.5 es como un Waymo. Le dices "llévame de A a B" y te lleva. Tras algunas de estas experiencias, tu cerebro se da cuenta de que "ah, vale. Ya vivimos en este mundo". Y entonces te enganchas. A partir de ese momento, nunca volverás a trabajar de la misma manera. EL AÑO DE LOS AGENTES Se ha promocionado el año 2025 como el año de los agentes, y Opus 4.5 + Claude Agent SDK es la combinación que hace que esa frase sea cierta. El SDK de Claude Agent es el mayor secreto a voces en IA actual. El arnés de un agente es casi tan importante como su modelo. Si tienes un arnés deficiente, es casi seguro que también tengas un modelo deficiente. Con el SDK, obtienes un arnés de agente de primera clase listo para usar, que ahora puedes combinar con Opus 4.5 para crear agentes reales que realmente funcionan. Me recuerda la cita de Alan Kay: «Quienes se toman el software en serio deberían crear su propio hardware». La versión del agente es: «Quienes se toman los modelos en serio deberían crear su propio arnés». Anthropic lo cree claramente, y está funcionando. La combinación de estas herramientas es mágica. Me describiría como alguien con una gran cantidad de mejoras, y el SDK de Claude Agent + Opus 4.5 es la siguiente mejora importante. Ahora hay otro OOM de nuevo valor económico latente en esta combinación, y es tarea de los desarrolladores sacarlo a la luz. Si usted era bajista con respecto a los agentes, ahora es el momento de volverse alcista. "TODO ESTO ES REAL" "¿Sabes qué es una locura? Que todo esto sea real". Esta fue la primera frase de Ilya sobre el estado de la IA en su entrevista con Dwarkesh, y comparto ese sentimiento. No puedo creer que Opus 4.5 sea real. Hubo varias veces, mientras trabajaba en Opus 4.5, en las que literalmente me recliné en mi silla y solté una carcajada audible por lo salvaje que es que vivamos en un mundo donde existe y donde los agentes son tan buenos. Nat Friedman tiene esta gran pregunta en su sitio web: "¿De dónde obtienes tu dopamina?" Cada vez más, recibo el mío de Claude. ANTRÓPICO LARGO Ayer vi una publicación donde alguien decía que Opus 4.5 fue lo más importante que le había sucedido en su carrera profesional. Esto será cierto para más personas en el futuro. Cada año, durante los últimos 3 años, Anthropic ha multiplicado por 10 sus ingresos: de 1 millón de dólares a 100 millones de dólares en 2023, de 100 millones de dólares a 1.000 millones de dólares en 2024 y de 1.000 millones de dólares a 10.000 millones de dólares en 2025. En una reciente entrevista con DealBook, Darío expresó que no estaba seguro de si ese patrón de 10 veces se mantendría en 2026. Aunque probablemente tenga razón, preveo que los ingresos de Anthropic a finales del próximo año serán mucho mayores de lo que todos esperan. No me sorprendería que superaran a OpenAI en valoración a principios de 2027. Opus 4.5 es un modelo demasiado bueno, Claude Agent SDK es un arnés demasiado bueno y su enfoque en la empresa es demasiado obviamente correcto. Claude Opus 4.5 es un ganador. Y Anthropic seguirá ganando.

--- REVISIÓN Y RECOMENDACIONES --- Ahora, algunas cosas más prácticas. A continuación, se presentan algunas cosas que me encantan de Opus 4.5 y que me han resultado útiles. Si quieres saber más, esta publicación me ha parecido un buen resumen de Opus 4.5. Reúne muchas anécdotas interesantes sobre el modelo. Descubrirás que es considerado una auténtica joya. GENERAL El mejor modelo mental para Opus 4.5 es pensar en él como un compañero de trabajo. Un verdadero colaborador en quien puedes confiar para lograr resultados. Confía en él más de lo que crees que deberías. Esto entrenará tu mente para adaptarse al futuro del trabajo y te dará resultados a corto y largo plazo. Confía en el modelo. Asígnale tareas más complejas. Deja que trabaje más tiempo. Vigila menos su progreso. Si no lo moderas de vez en cuando, no confías lo suficiente. - Simplemente divaga. Si aún no usas la voz como entrada, estás en la edad de piedra. Opus 4.5 puede convertir fácilmente un volcado mental de 5 minutos en una tarea completada, justo como esperarías que hiciera un gran compañero de equipo. - Opus 4.5 es más eficiente que Sonnet 4.5. Las capacidades de entrada de imágenes de Opus 4.5 se han mejorado significativamente. Experimente con ellas. La conversión de capturas de pantalla a código, en particular, ahora alcanza un nivel completamente nuevo. Usa Opus 4.5 con tu bóveda de Obsidian. Tengo un video de YouTube sobre esto aquí. Está un poco desactualizado y estoy trabajando en uno nuevo, pero te harás una idea. Experimenta con Opus 4.5 y el uso de la computadora. Aún no está listo para producción, pero verlo como un juguete es suficiente para que empieces a pensar. Preveo que 2026 será un año clave para el uso de la computadora, y vale la pena empezar con ventaja. Este es claramente el siguiente gran paso para los agentes. Si quieres aventurarte, prueba a trabajar con enjambres de agentes. Un buen punto de partida es tener un archivo https://t.co/swldq08QC9 que un equipo de agentes pueda usar para comunicarse y colaborar. Si de verdad quieres experimentar con enjambres, los ganchos del SDK de Claude Agent te resultarán esenciales.

Claude Code Claude Code + Opus 4.5 es la mejor herramienta de programación de IA del mundo. Úsala. Yo la uso en la terminal, pero también puedes usar Claude Code Desktop si prefieres una interfaz gráfica. Sigo apostando por la capacidad de Anthropic para ofrecer los mejores modelos de programación con la mejor gestión de agentes. En cuanto a herramientas de programación de IA, Claude Code tiene un mandato celestial. No puedo enfatizar lo suficiente el gran avance que supone Claude Code con Opus 4.5. Es indistinguible de la magia. El nuevo modo de planificación es absolutamente increíble. Este es otro ejemplo de la importancia de las liberaciones. Hay muchísima productividad encerrada tras un diseño de producto interesante. Han dado en el clavo con esto. Si no lo usas para tareas complejas, te estás perdiendo algo. Impulsa un rendimiento significativamente mejor. Ya no te preocupes por la disminución del rendimiento tras la compactación. Antes, tras compactar (debido a los límites de la ventana de contexto), se observaban caídas significativas en el rendimiento. Ya no. Sigue habiendo una pequeña disminución, pero Anthropic ha hecho un trabajo fantástico mejorando este aspecto interno, y Opus 4.5 es mucho mejor a la hora de inferir los elementos perdidos durante la compactación. Opus 4.5 es un buen diseñador. Aún no es de primera clase, pero ya hemos superado el problema de la IA. Usando herramientas como la habilidad de Diseño Frontend y la conversión de capturas de pantalla a código, se pueden obtener diseños bastante buenos. Las interfaces de IA ya son bastante buenas y siguen mejorando. El trabajo con el mejor de N es cada vez más útil. En la vida real, nunca pedirías a 5 desarrolladores que desarrollaran la misma función y luego eligieran la mejor. Pero con la IA, es pan comido. Opus 4.5 destaca en la ramificación especulativa, explicando las ventajas y desventajas de diferentes enfoques y colaborando contigo para elegir el mejor. Representa a la perfección el futuro del trabajo. Intenta escribir en pseudocódigo. La mayoría de la gente simplemente envía el mensaje al agente en el cuadro de entrada y pulsa "Enviar", y, por supuesto, yo también suelo trabajar así. Pero a veces, escribir en pseudocódigo en el código base puede ser increíblemente útil. Opus 4.5 es sorprendentemente bueno para inferir lo que quieres decir al escribir en pseudocódigo y desarrollarlo. De nuevo, no querrás usarlo siempre, pero para las tareas adecuadas es una forma de trabajar realmente interesante. SDK del agente CLAUDE Como se mencionó, este sigue siendo el mayor secreto a voces en IA actualmente. El SDK de Claude Agent es el mejor arnés de agentes del mundo, y combinarlo con Opus 4.5 es la mejor manera de crear agentes. Es realmente increíble. Profundiza. El SDK de Claude Agent es muy completo. Cuanto más lo conozcas, más podrás aprovecharlo. Suena a cliché, pero es cierto. He visto a mucha gente solo arañando la superficie antes de llegar a lo bueno. Los agentes aún pueden ser un problema de habilidad, así que tómate el tiempo para aprender lo que tienes a tu disposición y perfeccionar esas habilidades. Crea un agente con el SDK de Claude Agent. Y crea algo práctico. Un proyecto divertido para el fin de semana es pensar en tres cosas que haces con frecuencia en tu computadora y crear un agente que te ayude a automatizarlas. Una vez que hayas automatizado esas tres cosas, querrás automatizar más. La adicción a la automatización de agentes es real y útil. Implementar agentes en la nube puede ser un poco complicado para principiantes, ya que las típicas ofertas sin servidor, tan populares entre los programadores de vibe-coders, no admiten agentes aislados de larga duración. Existen muchas opciones para esto, aunque me encanta la experiencia de desarrollo de E2B. Superar la curva de aprendizaje inicial merece la pena. Aprender a implementar agentes en la nube permite, por ejemplo, que un enjambre de agentes trabaje para ti mientras duermes. Invierte tiempo en esto. Te dará buenos resultados.

Versión completa con enlaces amckaywrigley.com/posts/opus-4.52FmFo Es bueno estar de vuelta. Las vacaciones han terminado. Tengo un montón de cosas preparadas para las próximas dos semanas. Siente la AGI.

Hilo de Mckay Wrigley (@mckaywrigley)

Información del autor

Contenido del hilo