而且光是造型化妆就折腾了好几遍文字转WAV音频