里面是表演区文字转WAV音频