他们当然不愿意输给卡卡文字转WAV音频