他们只能是代表他们自己文字转WAV音频