根本应对不了这里复杂的环境文字转WAV音频