也包括学习空间中的那些训练任务文字转WAV音频