他们代表了各自家族的脸面文字转WAV音频