实际上你只需要保质保量完成我们在训练课上的正常训练文字转WAV音频