因为系统里的人物是按照性格类型文字转WAV音频