在尚不清楚周围状况的前提下文字转WAV音频