所以现在他要做的就是智取文字转WAV音频