但要像是影片中这样在一个长镜头里完成切换文字转WAV音频