[オープンソースモデル] BU-30B-A3B-Preview: @browser_use Qwen3-VL-30B-A3B-Instruct をベースに、「ブラウザを操作する」ことに特化した最新のオープンソース AI モデルにより、AI は人間のように Web ページを閲覧し、ボタンをクリックし、データを抽出することができ、パフォーマンスとコストの優れたバランスを実現します。 コアポジショニング: Webページをより深く理解するAI 従来の AI モデルは強力ですが、複雑な Web ページの DOM 構造を理解したり、「正確な視覚的配置」を実行したりするには十分な精度がないことがよくあります。 BU-30B-A3B-Previewは、この目的に特化して最適化されています。優れたDOM理解能力と視覚的推論能力を備え、Webページ要素を正確に識別できるため、自動Webエージェントの構築に最適な頭脳となります。 技術的なハイライト: 低コストで高性能 (MoE アーキテクチャ) • モデルアーキテクチャ:MoEアーキテクチャ • パラメータスケール:300億パラメータで、高度なインテリジェンスを実現 • 運用効率:実際の運用では、一度に30億パラメータのみがアクティブ化されます • 実用的意義:これは、「大規模モデル」と同等のインテリジェンスを備えながら、「小規模モデル」と同等のリソースしか消費しないことを意味します。単一のGPUで実行できるため、企業や個人にとって導入のハードルを大幅に下げます。 技術仕様: • ベースモデル: Alibaba の Qwen3-VL-30B-A3B-Instruct をベースに大幅にカスタマイズされています。 • コンテキストの長さ: 32k トークンをサポートし、非常に長い Web ページのコンテンツを一度に「表示」できます。 • モダリティ: コードを「読む」だけでなく、ページのスクリーンショットを「表示」することもできる視覚言語モデルです。 要約 BU-30B-A3B-Previewは、オープンソースのWebエージェント分野における強力なツールです。「大規模なモデルはコストがかかりすぎて遅く、小規模なモデルはWebページを理解するのが難しすぎる」といった従来の問題点を解決し、Webページタスク(自動テスト、データ収集、RPAプロセスなど)の自動化を必要とする開発者に最適です。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
![[オープンソースモデル] BU-30B-A3B-Preview: @browser_use Qwen3-VL-30B-A3B-Instruct をベースに、「ブラウザを操作する」ことに特化した最新のオープンソース AI モデルにより、AI](https://pbs.twimg.com/media/G8VTIU-a4AElOEj.jpg)