올해 인공지능 음성 분야에서 흥미로운 발전 중 하나는, 더 사람처럼 들리도록 모델을 "더 나쁘게" 만드는 것입니다. 제가 본 몇 가지 예를 들어볼까요? 지연 시간을 추가하고, 배경 소음을 추가하고, 응답성을 저하시키고(일시 정지 시 바로 재생하지 않음), 중단 가능성을 줄입니다(군더더기 말 때문에 멈추지 않음).
저는 내년에는 평균적인 음성 비서조차도 사람과 거의 구별할 수 없을 정도로 자연스러워질 것이라고 예측합니다. 이는 소비자의 의견을 반영하는 다양한 활용 가능성을 열어줍니다. 현실감을 높이는 "마지막 2%"가 고객 경험 유지에 핵심적인 역할을 할 수 있기 때문입니다.