按照镜头截取布景的角度打量了一眼文字转WAV音频