首先要拍的是从舞台面向观众席的全景镜头文字转WAV音频