再加一个镜头文字转WAV音频