最下端的确在逐步缩小文字转WAV音频