而是剧组准备拍摄的现场文字转WAV音频