这样的场景他已经预料到了文字转WAV音频