我们甚至可以推断文字转WAV音频