然后指导它做出一些动作文字转WAV音频