会随机从现场观众里选出4个人文字转WAV音频