他显然是在消化这样的信息文字转WAV音频