"Músicos deveriam adorar música feita por IA. Eles conseguem criar músicas a uma velocidade 1.000 vezes maior" - cara cujo gosto musical se resume a podcasts.
A conversão de texto para MP3 não é e nunca será o nível de abstração adequado. Na verdade, acredito que seja possível usar níveis de abstração "inferiores" (MIDI, texto -> amostra, etc.) ou "superiores" (por exemplo, dança/movimento -> mudanças de música), mas o texto simplesmente não é a modalidade de entrada correta para qualquer coisa séria.