Lancement de FLUX 2 : une avancée majeure dans le domaine de l’intelligence visuelle de pointe Black Forest Labs a sorti quatre versions cette fois-ci : • FLUX 2 [pro] : La version de la plus haute qualité, fournie via API, offrant vitesse et faible coût, atteignant un équilibre parfait entre qualité et vitesse. • FLUX 2 [flex] : Une version de contrôle de paramètres ouverte qui permet aux développeurs d'ajuster le nombre d'étapes et les coefficients de guidage, équilibrant librement la qualité, le respect des mots-clés et la vitesse. • FLUX 2 [dev] : Un modèle pondéré ouvert avec des paramètres 32 bits, actuellement le modèle de génération et d'édition d'images ouvert le plus puissant, capable de fonctionner localement sur une seule carte graphique RTX 4090. • FLUX 2 [klein] (bientôt disponible) : Un modèle open-source d'Apache 2.0, distillé à partir du modèle de base, plus léger mais toujours puissant. Points clés de l'innovation 1. Prise en charge de plusieurs images de référence : FLUX 2 peut référencer jusqu’à 10 images simultanément, garantissant une cohérence inégalée en matière de personnages, de produits ou de style. Ceci est particulièrement important pour la conception de marques et le développement de personnages. 2. Le modèle de réalisme et de détail ultime a été considérablement amélioré au niveau de l'éclairage, de la texture et de la logique spatiale, le rendant adapté à la photographie de produits, à la visualisation et aux scénarios d'application similaires à la photographie. 3. Amélioration du rendu du texte : Les typographies complexes, les infographies, les émojis et les textes fins des prototypes d’interface s’affichent désormais correctement en production. Ceci résout un problème persistant de précision du texte dans la génération d’images par IA. 4. L'édition haute résolution prend en charge la retouche d'images jusqu'à 4 mégapixels tout en conservant les détails et la cohérence. 5. Les invites améliorées démontrent une compréhension nettement améliorée des instructions complexes et structurées, y compris les invites en plusieurs parties et les contraintes de composition. Famille de modèles Architecture technique FLUX 2 repose sur une architecture de correspondance de flux latents, intégrant la génération et l'édition d'images au sein d'une architecture unique. Le modèle combine un modèle de langage visuel Mistral-3 à 24 paramètres avec un transformateur de flux modifié ; le premier apporte des connaissances du monde réel et une compréhension contextuelle, tandis que le second capture les relations spatiales, les propriétés des matériaux et la logique de composition. De plus, l'équipe a réentraîné l'espace latent du modèle (VAE) à partir de zéro, obtenant un meilleur équilibre entre l'apprentissage, la qualité et le taux de compression. Importance et impact : L’intérêt majeur de cette version réside dans sa transformation : d’un outil de démonstration de compétences techniques, il devient un véritable outil de productivité. FLUX 2 ne se limite pas à la création d’images esthétiques ; il permet de gérer efficacement les chartes graphiques, de garantir la cohérence stylistique, de restituer fidèlement les textes et de suivre des instructions complexes – autant d’exigences essentielles dans les processus créatifs. Le concept de « noyau ouvert » de Black Forest Labs est également remarquable : il fournit des API de qualité commerciale et publie des modèles de pondération ouverts, permettant aux chercheurs, aux créateurs et aux développeurs de participer à façonner l'avenir de l'intelligence visuelle, au lieu de la voir monopolisée par quelques entreprises. Il s'agit d'une avancée majeure vers les agents intelligents multimodaux : l'avenir de l'IA unifiera les capacités de perception, de génération, de mémoire et de raisonnement. FLUX 2 nous montre que cet avenir se rapproche rapidement.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
