Al realizar transmisiones en vivo o grabar videos, si desea agregar subtítulos en tiempo real al material de video, descubrirá que debe usar un servicio en la nube pago o hacerlo lentamente en la posproducción, lo cual es bastante problemático. Mientras navegaba por GitHub, me topé con LocalVocal, un complemento de código abierto que es una solución de conversión de voz a texto localizada diseñada específicamente para OBS. Ejecute modelos de IA directamente en su equipo local para convertir la voz en subtítulos de alta calidad en tiempo real, e incluso traducir simultáneamente (por ejemplo, del chino al inglés). No requiere conexión a internet ni costosas tarifas de API. GitHub: https://t.co/NeOgvwCN6g El núcleo está construido sobre los modelos ggml y Whisper, y existe como un filtro OBS estándar con una configuración muy simple. También admite tamaños de modelo personalizados, lo que permite a los usuarios elegir de forma flexible entre velocidad y precisión según la configuración de su computadora. Si eres un locutor o necesitas grabar videos instructivos con subtítulos, vale la pena probar esta solución fuera de línea de baja latencia y sin costo.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
