同时以眼角余光打量这里的环境文字转WAV音频