Aqui está um link para o conjunto de quatro ferramentas de vídeo que a Zhipu acaba de disponibilizar como código aberto: SCAIL, RealVideo, Kaleido e SSVAE. Ele abrange modos de captura de pose, streaming em tempo real e multiagente. O RealVideo, entre outros, gera streaming de vídeo em tempo real com um atraso inicial de som de 2 a 3 segundos, clonagem de voz de 3 segundos e permite o upload de avatares. Ele pode produzir vários minutos de vídeo com diálogos ou falas contínuas, permitindo que apresentadores virtuais comecem a transmitir em 2 segundos. O SCAIL consegue gerar cenas interativas complexas com várias pessoas, como cambalhotas e dança de rua, simplesmente fornecendo a foto de um ator e adicionando animação esquelética 3D, garantindo que os movimentos dos atores permaneçam consistentes e que quaisquer obstruções não sejam interrompidas. Existe também a estrutura de geração de vídeo multiagente Kaleido e o autoencoder variacional estruturado espectral VAE SSVAE. #Vídeo com IA #Transmissão ao vivo com IA #GLM
Pré-visualização dgithub.com/zai-org/SCAIL:github.com/zai-org/SCAIL-…s://t.huggingface.co/zai-org/SCAIL-… modelscope.cn/models/ZhipuAI…F https://t.cogithub.com/zai-org/RealVi… Códhuggingface.co/zai-org/RealVi…8modelscope.cn/models/ZhipuAI…t.co/6k86GIg7github.com/zai-org/KaleidodBj6 Caleido Código: https://t.co/NqSB9JlguW Modelo: https://t.co/0rpcHg1YzD https://t.co/lAFNHJ8yDk SSVAE Código: https://t.co/J9e2EsbNRz Modelo: