本身就会被默认是代表性人物文字转WAV音频