X (Twitter)

Recentemente, precisei criar um agente de voz degithub.com/TEN-framework/…zado e descobri este framework de código aberto, o TEN, https://t.co/ppXuYgithub.com/TEN-framework/…ogo multimodal em tempo real, é altamente extensível e pode integrar avatares e vários recursos avançados. Já possui 8,6 mil estrelas e, após pesquisá-lo, constatei que é muito poderoso. A documentação oficial fornece inúmeros exemplos: https://t.co/9BtiiM9TbZ por exemplo: Você pode experimentar o agente de IA para bate-papo por voz em tempo real em https://t.co/r5R2HTuzWz. Conversar um pouco é uma ótima maneira de praticar seu inglês falado. * Avatares de anime/digitais falam e fazem sincronização labial. Assistente de tradução multilíngue em tempo real * Transcrição de reuniões em tempo real * Atendimento telefônico ao cliente com inteligência artificial, etc. Com esses exemplos, agora você pode clonar diretamente o repositório TEN, modificar algumas chaves de API no arquivo .env e, em seguida, escolher um exemplo de agente correspondente (assistente de voz, avatar com sincronização labial, chamada SIP etc.) e modificar o prompt. Você pode executar rapidamente uma demonstração funcional.

Recentemente, precisei criar um agente de voz de IA simples e personalizado e descobri este framework de código aberto,

Thread de Viking (@vikingmute)

Informações do autor

Conteúdo da thread