所以他们才能认得出来文字转WAV音频