但是他并没有解释什么文字转WAV音频