他们便可以推断文字转WAV音频