而是先跟她解释文字转WAV音频