X (Twitter)

A StepFun AI afirma que este modelo representa um paradigma completamente novo para a edição de áudio: Em xiaohu.ai/c/a066c4/stepf…a partistepaudiollm.github.io/step-audio-edi… onda, utiliza tokens discretos para representar a fala, de forma semelhante a um modelo de linguagem. O áudio pode ser modificado em múltiplas dimensões, como emoção, estilo e velocidade da fala, através de comandos em linguagem natural. Detalhes: https://t.co/0vTbSAZVIq Endereço do projeto: https://t.co/1Q4sE34jXi GitHub: https://t.co/fyvQjCcKhW Experiência online:

A StepFun AI afirma que este modelo representa um paradigma completamente novo para a edição de áudio:

Em vez de proce

Thread de 小互 (@imxiaohu)

Informações do autor

Conteúdo da thread