他们分成了两股文字转WAV音频