并且是根据布置时间长短文字转WAV音频