其实什么都没有所有你所做的是确保他们都在镜头里文字转WAV音频