以及他们刚才的话语文字转WAV音频