再经过摄像机的捕捉文字转WAV音频