此时随着他的开口发问文字转WAV音频