因为这也是他们可以预料到的文字转WAV音频