然后一秒钟之后执行文字转WAV音频