二是因为上层的决定文字转WAV音频