而是他会不会利用环境文字转WAV音频