所以他们必须补救文字转WAV音频