而这样的要求其实从法理上来说是合理的文字转WAV音频