但是随着镜头开始不断聚焦放大文字转WAV音频