一大原因是旧版的人物们都是复杂的文字转WAV音频