A StepFun AI afirma que este modelo representa um paradigma completamente novo para a edição de áudio: Em xiaohu.ai/c/a066c4/stepf…a partistepaudiollm.github.io/step-audio-edi… onda, utiliza tokens discretos para representar a fala, de forma semelhante a um modelo de linguagem. O áudio pode ser modificado em múltiplas dimensões, como emoção, estilo e velocidade da fala, através de comandos em linguagem natural. Detalhes: https://t.co/0vTbSAZVIq Endereço do projeto: https://t.co/1Q4sE34jXi GitHub: https://t.co/fyvQjCcKhW Experiência online:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
