他们所做的第一件事情就是快速的向后退去文字转WAV音频