就相当于是将自己的脑袋放在了最前端文字转WAV音频