百度剛剛放出了:ERNIE-4.5-VL-28B-A3B-Thinking,主打“看圖思考”,會用圖像縮放、搜索等工具自由放大和縮小圖像 這提升了模型處理細粒度細節和長尾視覺知識能力,可以更全面地理解複雜的視覺場景 在VLMs Are Blind上超GPT-5-High、GEMINI-2.5-Pro 可以用來做多步驟推理、圖表分析、因果推論、STEM拍照解題、影片時序定位等 #百度ERNIE #VLM
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。