他们就必须在文字转WAV音频