他必须在这两秒钟之内做出应对文字转WAV音频