X (Twitter)

라이브 스트리밍이나 영상 녹화를 할 때 영상에 실시간 자막을 추가하고 싶다면 유료 클라우드 서비스를 이용하거나 후반작업에서 천천히 작업해야 하는데, 이는 꽤 번거로운 일입니다. GitHub을 탐색하던 중, OBS에 맞춰 특별히 설계된 현지화된 음성-텍스트 변환 솔루션인 오픈소스 플러그인 LocalVocal을 우연히 발견했습니다. 로컬 머신에서 직접 AI 모델을 실행하여 음성을 실시간으로 고품질 자막으로 변환하고, 중국어에서 영어로 번역하는 등 동시에 번역할 수도 있습니다. 인터넷 연결이 필요 없으며, 비싼 API 요금도 없습니다. GitHub: https://t.co/NeOgvwCN6g 핵심은 ggml과 Whisper 모델을 기반으로 구축되었으며, 매우 간단한 구성을 갖춘 표준 OBS 필터로 존재합니다. 또한 사용자 정의 모델 크기를 지원하므로 사용자는 컴퓨터 구성에 따라 속도와 정확도를 유연하게 선택할 수 있습니다. 방송인이거나 자막이 포함된 교육용 비디오를 녹화해야 하는 경우, 비용이 전혀 들지 않고 대기 시간이 짧은 이 오프라인 솔루션을 시도해 볼 가치가 있습니다.

GitHubDaily(@GitHub_Daily)의 스레드

작성자 정보

스레드 내용