这符合我们的推断文字转WAV音频