他们的目标必定是自己文字转WAV音频