是弄不清楚他们身份的文字转WAV音频