X (Twitter)

ライブ配信や動画録画をしているときに、動画にリアルタイムで字幕を追加したい場合、有料のクラウドサービスを利用するか、ポストプロダクションでじっくりやらなければならず、かなり面倒です。 GitHub を閲覧中に、OBS 専用に設計されたローカライズされた音声テキスト変換ソリューションであるオープンソースプラグインである LocalVocal を見つけました。 AIモデルをローカルマシンで直接実行することで、音声をリアルタイムで高品質な字幕に変換し、同時翻訳（中国語から英語など）も可能です。インターネット接続は不要で、高額なAPI料金もかかりません。 GitHub: https://t.co/NeOgvwCN6g コアは ggml および Whisper モデル上に構築されており、非常にシンプルな構成の標準 OBS フィルターとして存在します。また、カスタムモデルサイズもサポートされており、ユーザーはコンピューターの構成に応じて速度と精度を柔軟に選択できます。放送局の場合、または字幕付きの説明ビデオを録画する必要がある場合は、このゼロコストで低遅延のオフラインソリューションを試してみる価値があります。

GitHubDaily（@GitHub_Daily）のスレッド

作者情報

スレッド内容