摄像头无法捕捉到他的面部文字转WAV音频