所以他只是简单的说了一句为什么文字转WAV音频