毕竟他们选择的是佳斯特文字转WAV音频