很多效果都是依靠后期添加文字转WAV音频