Baidu acaba de lanzar ERNIE-4.5-VL-28B-A3B-Thinking, que se centra en "pensar a través de imágenes" y permite a los usuarios acercar y alejar libremente las imágenes utilizando el escalado de imágenes, la búsqueda y otras herramientas. Esto mejora la capacidad del modelo para manejar detalles minuciosos y conocimientos visuales de larga duración, lo que permite una comprensión más completa de escenas visuales complejas. Super GPT-5-High y GEMINI-2.5-Pro en VLMs son ciegos Puede utilizarse para razonamiento en múltiples pasos, análisis de gráficos, inferencia causal, resolución de problemas STEM basados en fotografías y localización temporal de vídeo. #BaiduERNIE #VLM
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
