其实每一次任务就是一次表演文字转WAV音频