给他们留出了足够的文字转WAV音频