是训练一阶段完成后的休整文字转WAV音频