所以我们必须卡着撤离的时间点文字转WAV音频