X (Twitter)

Alibaba lanza el modelo de vídeo Wan 2.6 Lanzamiento del primer juego de rol de China Se han realizado mejoras significativas en la calidad de la imagen, la estabilidad, los efectos de sonido y el cumplimiento de los comandos. 1️⃣ Cada vídeo puede tener una duración máxima de 15 segundos. 2️⃣ Soporta de forma nativa la generación integrada de "vídeo + audio" (sincronización audiovisual) 3️⃣ Generación de videos de juego de roles 4️⃣ Control de escena + cambio automático entre múltiples cámaras 5️⃣ Capacidad mejorada para fotografiar grupos mixtos de personas, objetos y objetos. 6️⃣ Capacidad significativamente mejorada para seguir instrucciones

El vídeo generado tiene una duración de hasta 15 segundos. Aumenta la capacidad de contenido espaciotemporal de la pantalla, favoreciendo una narrativa más completa.

Soporta de forma nativa la generación de “video + audio” de una sola vez (sincronización audiovisual). Tanto las imágenes como el audio son generados por IA. apoyo: Voz en off automática, sonido ambiental, diálogos de personajes. También admite la carga de audio personalizado para lograr una alineación audiovisual y de sincronización de labios.

Admite la carga de vídeos de referencia de personajes o roles. Luego especifique mediante mensaje: Personaje, estilo de interpretación, escena, atmósfera. El modelo se completará automáticamente: La actuación mantiene la coherencia con el personaje y los cambios emocionales dentro de la toma son consistentes.

Wan 2.6 agrega un control más explícito sobre los aspectos a nivel de escena: Apoyo en un solo video: Cambio automático de perspectivas entre múltiples tomas de diferentes encuadres El modelo puede: Mantener la coherencia en los personajes, el estilo y la narrativa.

Generación de controladores de audio Wan 2.6 puede generar vídeos basados en texto y audio ingresados por el usuario. Y lograr un rendimiento multicámara

El modelo de imagen basado en texto Wan 2.6 también se ha actualizado. En la versión 2.6, la capacidad de generar imágenes a partir de texto también ha dado un salto cualitativo. Ya no es sólo una herramienta para "convertir texto en imágenes", sino que ha comenzado a comprender verdaderamente la semántica y la lógica visual detrás del texto. Las imágenes son más precisas, el estilo más consistente, los personajes más estables y la iluminación más natural. Las imágenes generadas se asemejan al arte conceptual profesional o a los storyboards cinematográficos.

Introxiaohu.ai/c/xiaohu-ai/wa…s://t.ctongyi.aliyun.com/wan/uí: https://t.co/obNJXzDOdr

Introducción detallada: https://t.co/v7dGGtTK8B
Vívelo aquí: https://t.co/obNJXzDOdr

Hilo de 小互 (@imxiaohu)

Información del autor

Contenido del hilo