并通过镜头的角度和光暗的调整文字转WAV音频