但它们一般都是种群或者个体为主文字转WAV音频