所以他的学习流程也紧凑了不少文字转WAV音频