所有人就都得跟着文字转WAV音频