观众只能在后面挤挤攘攘的拍照文字转WAV音频