最终按照繁复的顺序变换多次后文字转WAV音频