第二阶段和后续的任务文字转WAV音频