바이두는 방금 ERNIE-4.5-VL-28B-A3B-Thinking을 출시했습니다. 이 버전은 "이미지를 통해 생각하기"에 초점을 맞추고 있으며, 사용자가 이미지 크기 조정, 검색 및 기타 도구를 사용하여 이미지를 자유롭게 확대/축소할 수 있도록 해줍니다. 이를 통해 모델은 세부적인 세부 사항과 긴밀한 시각적 지식을 처리하는 능력이 향상되어 복잡한 시각적 장면을 보다 포괄적으로 이해할 수 있습니다. VLM의 Super GPT-5-High 및 GEMINI-2.5-Pro는 블라인드입니다. 다단계 추론, 그래프 분석, 인과 추론, STEM 사진 기반 문제 해결, 비디오 시간적 위치 파악에 사용할 수 있습니다. #바이두어니 #VLM
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
