维持着后方的稳定文字转WAV音频