但他必须尽可能的文字转WAV音频