然后开始了互动的环节文字转WAV音频