[開源模型] BU-30B-A3B-Preview: @browser_use 最新開源的專為「操控瀏覽器」的AI 模型,基於Qwen3-VL-30B-A3B-Instruct,能讓AI 像人類一樣瀏覽網頁、點擊按鈕、提取數據,在性能和成本之間取得了極佳的平衡。 核心定位:更懂網頁的AI 普通的AI 模型雖然強大,但在理解複雜的網頁DOM 結構或進行「精準視覺定位」時,往往不夠準確。 BU-30B-A3B-Preview 是專門為此優化的。它具備卓越的DOM 理解能力和視覺推理能力,能夠精準辨識網頁元素,是建立自動化Web Agents 的理想大腦。 技術亮點:以小博大(MoE 架構) · 模型架構:MoE 架構· 參數規模:30B 參數,保證了強大的智能水平· 運行效率:實際運行時,每次只激活3B 參數· 實際意義:這意味著它擁有“大模型”的智商,卻只有“小模型”的資源消耗。它可以在單張GPU 上運行,大大降低了企業或個人部署的門檻。 技術規格· 基座模型:基於阿里的Qwen3-VL-30B-A3B-Instruct 進行深度自訂· 上下文長度:支援32k tokens,可以一次性「看」完非常長的網頁內容· 模態:視覺-語言模型,不僅能「讀取」代碼,還能「看」頁面截圖 總結 BU-30B-A3B-Preview 是目前開源界在Web Agent 領域的一個強力工具。它解決了過去「大模型太貴太慢,小模型太笨看不懂網頁」的痛點,非常適合需要自動化執行網頁任務(如自動化測試、資料收集、RPA 流程)的開發者使用。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
![[開源模型] BU-30B-A3B-Preview: @browser_use 最新開源的專為「操控瀏覽器」的AI 模型,基於Qwen3-VL-30B-A3B-Instruct,能讓AI 像人類一樣瀏覽網頁、點擊按鈕、提取數據,在性能和成本](https://pbs.twimg.com/media/G8VTIU-a4AElOEj.jpg)