ライブ配信や動画録画をしているときに、動画にリアルタイムで字幕を追加したい場合、有料のクラウドサービスを利用するか、ポストプロダクションでじっくりやらなければならず、かなり面倒です。 GitHub を閲覧中に、OBS 専用に設計されたローカライズされた音声テキスト変換ソリューションであるオープンソース プラグインである LocalVocal を見つけました。 AIモデルをローカルマシンで直接実行することで、音声をリアルタイムで高品質な字幕に変換し、同時翻訳(中国語から英語など)も可能です。インターネット接続は不要で、高額なAPI料金もかかりません。 GitHub: https://t.co/NeOgvwCN6g コアは ggml および Whisper モデル上に構築されており、非常にシンプルな構成の標準 OBS フィルターとして存在します。 また、カスタム モデル サイズもサポートされており、ユーザーはコンピューターの構成に応じて速度と精度を柔軟に選択できます。 放送局の場合、または字幕付きの説明ビデオを録画する必要がある場合は、このゼロコストで低遅延のオフライン ソリューションを試してみる価値があります。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
