也就是传统术士和普通人文字转WAV音频