[오픈 소스 모델] BU-30B-A3B-Preview: @browser_use Qwen3-VL-30B-A3B-Instruct를 기반으로 "브라우저 조작"에 특화된 최신 오픈 소스 AI 모델입니다. 이 모델을 통해 AI는 사람처럼 웹 페이지를 탐색하고, 버튼을 클릭하고, 데이터를 추출할 수 있으며, 성능과 비용 측면에서 탁월한 균형을 이룹니다. 핵심 포지셔닝: 웹 페이지를 더 잘 이해하는 AI 강력한 성능을 자랑하는 기존 AI 모델은 복잡한 웹 페이지 DOM 구조를 이해하거나 "정확한 시각적 위치 지정"을 수행하는 데 있어 정확도가 부족한 경우가 많습니다. BU-30B-A3B-Preview는 이러한 목적에 최적화되어 있습니다. 뛰어난 DOM 이해력과 시각적 추론 능력을 갖추고 있어 웹 페이지 요소를 정확하게 식별할 수 있으므로 자동화된 웹 에이전트를 구축하는 데 이상적인 핵심 구성 요소입니다. 기술적 특징: 저비용 고성능 (MoE 아키텍처) • 모델 아키텍처: MoE 아키텍처 • 파라미터 규모: 300억 개의 파라미터로 높은 수준의 인텔리전스 구현 • 운영 효율성: 실제 운영 시에는 30억 개의 파라미터만 동시에 활성화 • 실용적 의의: "대형 모델" 수준의 인텔리전스를 갖추면서도 "소형 모델" 수준의 리소스만 소비한다는 의미입니다. 단일 GPU에서도 실행 가능하므로 기업이나 개인 사용자의 도입 장벽을 크게 낮춥니다. 기술 사양: • 기본 모델: Alibaba의 Qwen3-VL-30B-A3B-Instruct를 기반으로 심층적으로 맞춤화되었습니다. • 컨텍스트 길이: 32,000개의 토큰을 지원하여 사용자가 매우 긴 웹페이지 콘텐츠를 한 번에 "볼" 수 있습니다. • 모달리티: 시각적 언어 모델로, 코드를 "읽을" 뿐만 아니라 페이지 스크린샷도 "볼" 수 있습니다. 요약하다 BU-30B-A3B-Preview는 오픈 소스 웹 에이전트 분야에서 강력한 도구입니다. "대규모 모델은 비용이 많이 들고 속도가 느리며, 소규모 모델은 웹 페이지를 이해하기에 너무 복잡하다"는 기존의 문제점을 해결하여 웹 페이지 관련 작업(자동화된 테스트, 데이터 수집, RPA 프로세스 등) 자동화가 필요한 개발자에게 매우 적합합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
![[오픈 소스 모델] BU-30B-A3B-Preview: @browser_use Qwen3-VL-30B-A3B-Instruct를 기반으로 "브라우저 조작"에 특화된 최신 오픈 소스 AI 모델입니다. 이 모델을 통해 A](https://pbs.twimg.com/media/G8VTIU-a4AElOEj.jpg)