所以他们都是准备从后面往前看文字转WAV音频