并不需要总是出面管理文字转WAV音频