Alibaba lance le modèle vidéo Wan 2.6 Lancement de la première fonctionnalité de jeu de rôle en Chine Des améliorations significatives ont été apportées à la qualité d'image, à la stabilité, aux effets sonores et à la conformité aux commandes. 1️⃣ Chaque vidéo peut durer jusqu'à 15 secondes. 2️⃣ Prend en charge nativement la génération intégrée de « vidéo + audio » (synchronisation audio-visuelle) 3️⃣ Génération de vidéos de jeux de rôle 4️⃣ Contrôle des scènes + commutation automatique entre plusieurs caméras 5️⃣ Capacité améliorée à tirer sur des groupes mixtes de personnes, d'objets et d'objets. 6️⃣ Amélioration significative de la capacité à suivre les instructions
La vidéo générée dure jusqu'à 15 secondes. Elle augmente la capacité de contenu spatio-temporel de l'écran, permettant ainsi une narration plus complète.
Prend en charge nativement la génération de « vidéo + audio » en une seule opération (synchronisation audio-visuelle). Les éléments visuels et audio sont tous deux générés par l'IA. soutien: Voix off automatique, son ambiant, dialogues des personnages Il permet également d'importer des fichiers audio personnalisés pour obtenir un alignement audiovisuel et labial parfait.
Permet de télécharger des vidéos de référence de personnages ou de rôles. Spécifiez ensuite via l'invite : Personnage, style de jeu, scène, ambiance Le modèle se complétera automatiquement : L'interprétation reste cohérente avec le personnage, et les changements émotionnels au sein du plan sont constants.
Wan 2.6 ajoute un contrôle plus explicite sur les aspects au niveau de la scène : L'assistance en une seule vidéo : Basculement automatique des perspectives entre plusieurs prises de vue de cadrages différents Le modèle peut : Veillez à la cohérence des personnages, du style et du récit.
génération de pilotes audio Wan 2.6 peut générer des vidéos à partir de texte et d'audio saisis par l'utilisateur. Et atteindre des performances multicaméras
Le modèle d'image textuel Wan 2.6 a également été mis à niveau. Dans la version 2.6, la capacité à générer des images à partir de texte a également fait un bond qualitatif. Ce n'est plus seulement un outil pour « transformer du texte en images », mais il a commencé à véritablement comprendre la sémantique et la logique visuelle qui sous-tendent le texte. Les images sont plus précises, le style plus homogène, les personnages plus harmonieux et l'éclairage plus naturel. Les images générées se rapprochent des illustrations conceptuelles professionnelles ou des storyboards de films.
Présexiaohu.ai/c/xiaohu-ai/wa…ps://t.tongyi.aliyun.com/wan/z-le ici : https://t.co/obNJXzDOdr

