就是为了将留给我们的反应时间压缩到最短文字转WAV音频