X (Twitter)

오늘 오후에 @cartesia_ai의 최신 Sonic 3 TTS를 TEN에 추가했습니다. 이 TTS는 상태 공간 모델 아키텍처를 사용합니다. 그들은 속도, 감정, 표현력 측면에서 기존의 변압기 훈련 TTS 모델보다 성능이 뛰어나다고 주장합니다. 중국어도 지원하지만, 제 경험상 중국어는 충분히 정통적이지 않습니다. 미국식 사투리가 약간 강합니다. 옛말이 여전히 맞는 것 같습니다. 격차를 메우려면 TTS(번역 및 응답 시스템)에 억양이 들어가면 안 됩니다. 억양이 있으면 어색하게 느껴질 테니까요. 어쩌면 TTS를 진정으로 효과적으로 구현하려면 현지인이 여전히 필요할지도 모릅니다.

艾略特(@elliotchen100)의 스레드

작성자 정보

스레드 내용