但同时他们还要面对文字转WAV音频