所以他们只能不断的后撤文字转WAV音频