他们绝大多数是普通人文字转WAV音频