拒绝的话还是从口里溢出文字转WAV音频