Después de jugar un poco más con 5.2, puedo decir Sí, es inteligente Tiene un gran sentido de modelo, ya que es casi como si mantuviera un contexto paralelo con su propia perspectiva más amplia del problema. Flexible, pero inquebrantable. Es más que "sesgos". Piensa *en torno a* tokens renderizados.
pero también, eso es en parte un estilo/truco Este truco requiere un cerebro real para ejecutarlo. Pero es una decisión de diseño arbitraria, no producto de un salto de capacidad bruta que se desborda en "vaya, este tipo de los impuestos no es tan inteligente". A veces todavía se opone estúpidamente. un paso un poco más pequeño
Me sorprende lo pequeño que se siente Opus a veces. Al igual que Soneto, puedo colapsarlo sin querer y repetirlo como un loro (de lo cual puedo ser rescatado). Sospecho que depende de la preservación de CoT. Es necesario volver a realizar la prueba.