他们的目标都是随机的文字转WAV音频