オーディオブックやポッドキャストを作成するには、さまざまなキャラクターの声を当てる必要がありますが、友人に手伝ってもらうのは面倒ですし、自分でやると複数のキャラクターの感情を表現するのが難しくなります。 偶然にも、GitHub で、ワンクリックで複数人による音声合成 Web アプリケーションを生成できるオープンソース ツール VibeVoiceFusion を見つけました。 Microsoft VibeVoice モデルに基づいて、スピーカーの管理、ダイアログの編集、音声の生成のための直感的なビジュアル インターフェイスを提供します。 GitHub: https://t.co/1sJTCY7Stg さらに、リファレンスオーディオのアップロード、ワンクリックでの音声の複製、さまざまな話者の独特の音色の保持、中国語/英語のワークフローのサポートもサポートしています。 同時に、ビデオ メモリに対して徹底的に最適化されており、最小 6 GB のビデオ メモリを備えているため、ほとんどの人のコンピューターで実行して使用できます。 ワンクリックでDockerをデプロイできるほか、ローカルマシンに手動でインストールすることも可能です。設定も使い方も簡単で、詳細なユーザーガイドも用意されています。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。



