百度剛剛放出了:ERNIE-4.5-VL-28B-A3B-Thinking,主打“看圖思考”,會用圖像縮放、搜索等工具自由放大和縮小圖像 這提升了模型處理細粒度細節和長尾視覺知識能力,可以更全面地理解複雜的視覺場景 在VLMs Are Blind上超GPT-5-High、GEMINI-2.5-Pro 可以用來做多步驟推理、圖表分析、因果推論、STEM拍照解題、影片時序定位等 #百度ERNIE #VLM
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。