看来持续时间不长是唯一的弱点文字转WAV音频