[Modèle Open Source] BU-30B-A3B-Preview : @browser_use Le dernier modèle d'IA open source spécialement conçu pour « manipuler les navigateurs », basé sur Qwen3-VL-30B-A3B-Instruct, permet à l'IA de naviguer sur les pages Web, de cliquer sur les boutons et d'extraire des données comme les humains, atteignant un excellent équilibre entre performance et coût. Positionnement clé : Une IA qui comprend mieux les pages web Bien que puissants, les modèles d'IA conventionnels ne sont souvent pas assez précis lorsqu'il s'agit de comprendre les structures DOM complexes des pages Web ou d'effectuer un « positionnement visuel précis ». BU-30B-A3B-Preview est spécialement optimisé à cet effet. Doté d'une compréhension DOM et de capacités de raisonnement visuel supérieures, il identifie avec précision les éléments des pages web, ce qui en fait le cerveau idéal pour la création d'agents web automatisés. Points forts techniques : Hautes performances à faible coût (architecture MoE) • Architecture du modèle : Architecture MoE • Nombre de paramètres : 30 milliards de paramètres, garantissant un haut niveau d’intelligence • Efficacité opérationnelle : En pratique, seuls 3 milliards de paramètres sont activés simultanément • Intérêt pratique : Ce modèle possède l’intelligence d’un modèle complexe tout en consommant les ressources d’un modèle simple. Il peut s’exécuter sur un seul GPU, ce qui facilite grandement son déploiement pour les entreprises et les particuliers. Spécifications techniques : • Modèle de base : Fortement personnalisé à partir de l’instruction Qwen3-VL-30B-A3B d’Alibaba. • Longueur du contexte : Prend en charge 32 000 jetons, permettant aux utilisateurs de visualiser simultanément le contenu de pages web très longues. • Modalité : Modèle visuel-langage, capable non seulement de lire le code, mais aussi de visualiser des captures d’écran de pages. Résumer BU-30B-A3B-Preview est un outil puissant dans le domaine des agents Web open source. Il résout les problèmes rencontrés par le passé, où « les modèles volumineux sont trop coûteux et lents, et les modèles réduits trop complexes pour interpréter les pages Web », ce qui le rend particulièrement adapté aux développeurs qui ont besoin d'automatiser des tâches liées aux pages Web (telles que les tests automatisés, la collecte de données et les processus RPA).
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
![[Modèle Open Source] BU-30B-A3B-Preview : @browser_use Le dernier modèle d'IA open source spécialement conçu pour « mani](https://pbs.twimg.com/media/G8VTIU-a4AElOEj.jpg)