他其实并没有把握文字转WAV音频