Además, una fotografía de una vista nocturna tomada en el norte de Shenzhen (Figura 1). Sin ninguna indicación, puede determinar la ubicación específica de disparo basándose en las características arquitectónicas de la imagen (Figura 2). Y se basa en razonamientos y pruebas sólidas, lo cual es realmente impresionante.
En general, la capacidad de "pensamiento visual" introducida por este modehuggingface.co/baidu/ERNIE-4.…e fuerte; parece ser capaz de ver y comprender la información de las imágenes. Todavía no hay ninguna demostración en línea disponible, pero el modelo es de código abierto. Descarga el modelo: https://t.co/WOYawrwuZL

