但从现场的环境明显能够看出文字转WAV音频