也就是说这个人群只会多不会少文字转WAV音频