Amp cambió el modelo predeterminado de Gemini 3 a Claude Opus 4.5 y, en pruebas reales, mostró una actualización integral con costos sorprendentemente más bajos. El rápido cambio se produjo tan solo una semana después de que @AmpCode cambiara su modelo principal de Claude a Gemini 3, una decisión que en su momento se consideró un "cambio histórico". Ahora, han vuelto rápidamente a la versión más reciente de Claude, Opus 4.5. Esto se debe a que, si bien Gemini 3 ofrece un rendimiento excelente, también presenta importantes deficiencias: problemas considerados "debilidades" durante las pruebas internas resultaron en una experiencia de usuario muy frustrante en el uso real y, además, resultaron costosos. Ventajas y rendimiento de Claude Opus 4.5: Opus 4.5 es comparable a Gemini 3 en cuanto a capacidad. Si bien su rendimiento máximo puede no ser tan impresionante como el de Gemini 3, es más estable y confiable, sin debilidades evidentes. • Mayor velocidad: tiempo de respuesta más rápido en el uso real. • Increíblemente rentable: Aunque los tokens individuales de Opus son más caros, el costo real de uso es menor. Las razones incluyen: • Se necesitan menos fichas para completar las tareas. • Menos errores, lo que reduce el desperdicio de fichas. • Se requiere menos intervención humana (mejora la tasa de aciertos de caché, reduciendo aún más los costos y la latencia) Comparación de datos específicos: Precisión: Opus 4.5 (57,3%) > Gemini 3 (53,7%) > Sonnet 4.5 (37,1%) • Costo promedio del hilo: Opus 4.5 ($2.05) ≈ Gemini 3 ($2.04) < Sonnet 4.5 ($2.75) • Coste de descontrol: Opus 4.5 (2,4%) es significativamente inferior que Gemini 3 (17,8%) y Sonnet 4.5 (8,4%). • Velocidad: Sonnet 4.5 (2,4 minutos) es el más rápido, Opus 4.5 (3,5 minutos) es más rápido que Gemini 3 (4,3 minutos). Casos de uso recomendados para Opus 4.5: • Importante ventaja en costos al gestionar hilos de diálogo de larga duración (más de 200 000 tokens). • Cuando otros modelos encuentran cuellos de botella de capacidad o errores frecuentes. • Al gestionar tareas más complejas y ambiguas. Dirección del artículo
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
