只有两种情况会发生文字转WAV音频