오늘 오후에 @cartesia_ai의 최신 Sonic 3 TTS를 TEN에 추가했습니다. 이 TTS는 상태 공간 모델 아키텍처를 사용합니다. 그들은 속도, 감정, 표현력 측면에서 기존의 변압기 훈련 TTS 모델보다 성능이 뛰어나다고 주장합니다. 중국어도 지원하지만, 제 경험상 중국어는 충분히 정통적이지 않습니다. 미국식 사투리가 약간 강합니다. 옛말이 여전히 맞는 것 같습니다. 격차를 메우려면 TTS(번역 및 응답 시스템)에 억양이 들어가면 안 됩니다. 억양이 있으면 어색하게 느껴질 테니까요. 어쩌면 TTS를 진정으로 효과적으로 구현하려면 현지인이 여전히 필요할지도 모릅니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.