而不是根据长短文字转WAV音频