准备提前预判一个位置文字转WAV音频