他们必须利用文字转WAV音频