每阶段需要在限定时间内完成文字转WAV音频