就是为了一次性的将最恶劣的结果说出来文字转WAV音频