并且通过镜头语言完全雕刻出来文字转WAV音频