也就是通俗意义上的领域文字转WAV音频