接着由服务生一一收起文字转WAV音频