¡Jaja! Acaban de lanzar GPT-5.2 y ya está recibiendo un ataque sorpresa. El evento de lanzamiento de GPT-5.2 presentó una caja que mostraba las marcas de identificación de componentes e interfaces en una placa base de computadora para destacar su potencia. Sin embargo, el ingeniero de Google DeepMind, @bcaine, la ejecutó directamente con Gemini-3.0-pro y obtuvo un rendimiento completamente superior. Reproduje el resultado usando su método y funcionó a la perfección. La imagen muestra mi reproducción. Como pueden ver, las marcas de Gemini-3.0-pro son extremadamente precisas. Esta caja GPT-5.2, por otro lado, probablemente fue seleccionada después de varias ejecuciones... El método específico es el siguiente: Primero, envíe el gráfico GPT-5.2 a nano-banana-pro para eliminar sus cuadros de etiquetas. Luego, envíe el gráfico sin etiquetar de vuelta a gemini-3.0-pro. El mensaje es el siguiente: Por favor, ayúdenme a usar las coordenadas entre [0, 1000] para etiquetar los cuadros delimitadores visuales de todos los componentes e interfaces en la imagen, y luego usar un script de Python para mostrarlos en la imagen. Use cuadros de diferentes colores para etiquetar los diferentes tipos de componentes e interfaces. Sea detallado, como un manual de usuario. (Recuerde habilitar la herramienta de ejecución de código) Estos son los enlaces que ejecuté: https://t.co/KOoWrQvQrg, https://t.co/fCKDtdYzmr Publicación original:
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.



