X (Twitter)

Recientemente agregamos una función de reconocimiento de múltiples personas a TEN. Esta característica tiene un nombre específico: Diarización. Puede reconocer diferentes voces en una conversación. Cada sonido fue etiquetado como "hablante 0" o "hablante 1". Este escenario puede considerarse esencial para la IA conversacional. Siempre pensé que no había muchas herramientas ASR/STT con esta función. Hice una búsqueda rápida y descubrí que hay otras herramientas ASR/STT compatibles con esta función, además de ser de código abierto y gratuitas, lo cual es genial. Dirección en la sección de comentarios 👇

ASR divegithub.com/modelscope/Fun…FFLGyY9 Diarización github.com/MahmoudAshraf9…o/oxcc1GkexH

Hilo de 艾略特 (@elliotchen100)

Información del autor

Contenido del hilo