我们从一开始就被当做了可有可无的助力文字转WAV音频