アリババがWan 2.6ビデオモデルをリリース 中国初のロールプレイングゲームをリリース 画質、安定性、サウンド効果、コマンドコンプライアンスが大幅に改善されました。 1️⃣ 各ビデオの長さは最大 15 秒です。 2️⃣「ビデオ + オーディオ」(オーディオとビジュアルの同期)の統合生成をネイティブにサポート 3️⃣ ロールプレイビデオの生成 4️⃣ シーンコントロール + 複数カメラの自動切り替え 5️⃣ 人、物、オブジェクトの混合グループを撮影する機能が強化されました。 6️⃣ 指示に従う能力が大幅に向上しました
生成されるビデオの長さは最大 15 秒です。 画面の空間的・時間的なコンテンツ容量が増大し、より完全な物語をサポートします。
「ビデオ + オーディオ」の一括生成 (オーディオとビジュアルの同期) をネイティブにサポートします。 映像と音声はどちらも AI によって生成されます。 サポート: 自動音声、環境音、キャラクターのセリフ また、オーディオとビジュアル、リップシンクの調整を実現するためのカスタムオーディオのアップロードもサポートしています。
キャラクターや役割の参考動画のアップロードをサポートします。 次にプロンプトで指定します: キャラクター、演技スタイル、シーン、雰囲気 モデルは自動的に完了します。 演技はキャラクターとの一貫性を保っており、ショット内の感情の変化も一貫しています。
Wan 2.6 では、シーン レベルの側面に対するより明示的な制御が追加されました。 1 つのビデオでサポート: 異なるフレーミングの複数のショット間の視点の自動切り替え このモデルでは次のことが可能です。 登場人物、スタイル、物語の一貫性を保ちます。
オーディオドライバの生成 Wan 2.6 は、ユーザーが入力したテキストとオーディオに基づいてビデオを生成できます。 マルチカメラ性能を実現
Wan 2.6 テキストベースのイメージ モデルもアップグレードされました。 バージョン 2.6 では、テキストから画像を生成する機能も質的に向上しました。 これはもはや単なる「テキストを画像に変換する」ツールではなく、テキストの背後にある意味と視覚的なロジックを真に理解し始めています。 画像はより精細になり、スタイルはより一貫性があり、キャラクターはより安定し、照明はより自然になりました。生成された画像は、プロのコンセプトアートや映画レベルのストーリーボードに近いものになっています。
詳しい紹介xiaohu.ai/c/xiaohu-ai/wa…B こちらからtongyi.aliyun.com/wan/obNJXzDOdr

