他们选择的会是默默承受文字转WAV音频