一方面是因为种族血统区别文字转WAV音频