其余的人都是观众文字转WAV音频