刚才说话的人也是再次的开口道文字转WAV音频