所以他们也非常的理解文字转WAV音频