这是从实际情况上做出的推理文字转WAV音频