X (Twitter)

オーディオブックやポッドキャストを作成するには、さまざまなキャラクターの声を当てる必要がありますが、友人に手伝ってもらうのは面倒ですし、自分でやると複数のキャラクターの感情を表現するのが難しくなります。偶然にも、GitHub で、ワンクリックで複数人による音声合成 Web アプリケーションを生成できるオープンソースツール VibeVoiceFusion を見つけました。 Microsoft VibeVoice モデルに基づいて、スピーカーの管理、ダイアログの編集、音声の生成のための直感的なビジュアルインターフェイスを提供します。 GitHub: https://t.co/1sJTCY7Stg さらに、リファレンスオーディオのアップロード、ワンクリックでの音声の複製、さまざまな話者の独特の音色の保持、中国語/英語のワークフローのサポートもサポートしています。同時に、ビデオメモリに対して徹底的に最適化されており、最小 6 GB のビデオメモリを備えているため、ほとんどの人のコンピューターで実行して使用できます。ワンクリックでDockerをデプロイできるほか、ローカルマシンに手動でインストールすることも可能です。設定も使い方も簡単で、詳細なユーザーガイドも用意されています。

GitHubDaily（@GitHub_Daily）のスレッド

作者情報

スレッド内容