他的话语中既是质问文字转WAV音频