Ao fazer transmissões ao vivo ou gravar vídeos, se você quiser adicionar legendas em tempo real à filmagem, perceberá que precisa usar um serviço pago na nuvem ou fazer isso lentamente na pós-produção, o que é bastante trabalhoso. Enquanto navegava no GitHub, me deparei com o LocalVocal, um plugin de código aberto que é uma solução de transcrição de fala em texto localizada, projetada especificamente para o OBS. Execute modelos de IA diretamente em sua máquina local para converter fala em legendas de alta qualidade em tempo real e até mesmo traduzir simultaneamente (como do chinês para o inglês). Não é necessária conexão com a internet e não há taxas caras de API. GitHub: https://t.co/NeOgvwCN6g O núcleo é construído com base nos modelos ggml e Whisper, e existe como um filtro OBS padrão com configuração muito simples. Ele também suporta tamanhos de modelo personalizados, permitindo que os usuários escolham de forma flexível entre velocidade e precisão com base na configuração do computador. Se você é um locutor ou precisa gravar vídeos instrucionais com legendas, vale a pena experimentar esta solução offline de baixo custo e baixa latência.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
