因为毕竟我们不可能未卜先知文字转WAV音频