这次我们只需被动防御文字转WAV音频